الجمعة - 29 مارس 2024
الجمعة - 29 مارس 2024

«ميتا» ستجعل صوت العالم الافتراضي كالحقيقي

«ميتا» ستجعل صوت العالم الافتراضي كالحقيقي

تعمل شركة ميتا مع مجموعة من الباحثين من جامعة تكساس الأمريكية على تحسين الجانب الصوتي من عالم ميتافيرس الافتراضي، ليكون شبيهاً بالعالم الحقيقي، وفقاً لتقرير نشره موقع Tech Radar.

وقالت كريستين غارومان، مديرة الأبحاث في قسم الذكاء الاصطناعي لدى شركة ميتا، إن هناك أموراً متعلقة بالواقع المعزز والواقع الافتراضي أكثر من مجرد الجانب المرئي. وأوضحت أن الصوت يلعب دوراً مهماً جداً في صنع عالم يجعل الناس يشعرون بأنه حقيقي ومليء بالحياة.

وأضافت غارومان أن الصوت تشكله البيئة التي يكون فيها. وهناك عوامل مختلفة تؤثر على طريقة عمل الصوت والتقنيات التي تجعل المستخدم يشعر بواقعية آتية منه، فمثلاً عند التكلم في مكان ما، يكون للصوت الصادر مدى معين، أي أن المستخدم قد يشعر بأن الصوت آت من مصدر بعيد أو قريب.

ولتحقيق هذا، تخطط ميتا لاستخدام نظارات الواقع المعزز لتسجيل كل من الصوت والفيديو من موقع واحد، ثم استخدام مجموعة من ثلاثة نماذج للذكاء الاصطناعي، وتحويل التسجيل وتنظيفه لكي يعطي شعوراً بأنه يحدث أمام المستخدم عندما يعيد تشغيله في المنزل. وسيأخذ الذكاء الاصطناعي في الحسبان الغرفة التي يجلس فيها المستخدم من أجل التوافق مع البيئة.

وعند النظر إلى المشاريع، يبدو أن ميتا تركز على نظارات الواقع المعزز. وتخطط الشركة لجعل نظارات الواقع الافتراضي تشمل تقليد المناظر والأصوات الموجودة في البيئة المحيطة، مثل الحفلة، لكي تعطي شعوراً بأن المستخدم موجود داخل الحفلة شخصياً.

التحويل عبر الذكاء الاصطناعي

السؤال الذي يطرح نفسه، هو كيف تستطيع ميتا أن تسجل صوتاً على نظارات الواقع المعزز وتجعله يعكس بيئة جديدة؟

هنا حلٌ يسمى «نموذج التوفيق المرئي الصوتي» وهو طريقة للذكاء الاصطناعي لتحويل الصوت كي يتوافق مع البيئة الجديدة. وقدمت ميتا مثالاً على ذلك، حيث قامت أم بتسجيل مقطع لابنها وهو يرقص في مسرح، وقد فعلت ذلك باستخدام نظارة واقع معزز.

وقال أحد الباحثين إن هذه الأم يمكنها أن تأخذ ذلك التسجيل وتعيد تشغيله في المنزل حيث سيقوم الذكاء الاصطناعي بتحويل الصوت عن طريق إجراء مسح للبيئة الجديدة ومراعاة أي عوائق موجودة في الغرفة، ومن ثم إصدار صوت المقطع كما لو أنه يحدث أمامها بنفس النظارة. وقال الباحث إن الصوت سيأتي من النظارة.

لتبسيط الأمر، تعمل التقنية على إزالة الأمور المشتتة للتركيز من المقطع. ومن الأمثلة على هذا تسجيل حفلة للعزف على الكمان في محطة للقطار، وعند أخذ التسجيل إلى المنزل، وجعل الذكاء الاصطناعي ينظفه، لا يسمع المستخدم أي شيء سوى الموسيقى.

هناك نموذج ذكاء اصطناعي آخر، وهو الصوت المرئي، الذي يستخدم مزيجاً من الإشارات الصوتية والمرئية لفصل الأصوات عن مصادر الضجيج الأخرى. فتخيل تسجيل مقطع فيديو لشخصين يتجادلان. سيقوم الذكاء الاصطناعي هنا بعزل صوت واحد لكي تتمكن من فهمهما عند كتم صوت كل شيء آخر. وأوضحت ميتا أن الإشارات المرئية مهمة لأن الذكاء الاصطناعي يحتاج إلى رؤية من الذي يتحدث لكي يفهم فروقاً دقيقة معينة ويعرف من الذي يتحدث.