بات استخدام أنظمة الذكاء الاصطناعي أمرا لا مفرّ منه لدى شركات التكنولوجيا خصوصا في ظل ما تقدّمه من خدمات جديدة تتميّز بها عن الأخرى.ومؤخرا، كشفت شركة بايت دانس المالكة لتطبيق "تيك توك"، عن نموذج ذكاء اصطناعي جديد يُدعى INFP. ويمكّن هذا النموذج من تحويل الصور الشخصية الثابتة إلى مقاطع فيديو تظهر فيها الصور كأنها تتحدث وتتفاعل مع المدخلات الصوتية. ويتميز نموذج INFP بقدرته على إنشاء مقاطع فيديو لمحادثات واقعية بين شخصين دون الحاجة إلى تحديد أدوار التحدث والاستماع يدويًا. ويتكون النظام الجديد من مرحلتين أساسيتين، ترتكز الأولى على تقليد حركات الرأس عبر التقاط التفاصيل الدقيقة، مثل تعابير الوجه وحركات الرأس من مقاطع الفيديو، وتحويلها إلى بيانات قابلة للاستخدام لتحريك الصور الثابتة. أما المرحلة الثانية، ستقوم على توليد الحركات استنادًا إلى الصوت، وتحلل الصوت لإنشاء أنماط حركة طبيعية للتحدث والاستماع، مع تعديل هذه الأنماط لتتوافق بشكل واقعي مع الصوت، بحسب بوابة التقنية. مميزات النموذج الجديدوعملت "بايت دانس" على تطوير قاعدة بيانات جديدة تُسمى DyConv، تضم أكثر من 200 ساعة من محادثات حقيقية جُمعت من الإنترنت.وتتميز القاعدة بقدرتها على التقاط نطاق أوسع من المشاعر الإنسانية بجودة فيديو أفضل مقارنة بقواعد بيانات أخرى مثل ViCo و RealTalk. وأكّدت مالكة "تيك توك" أن نموذج الذكاء الاصطناعي الخاص بها، يتفوق على الأدوات الحالية في مطابقة حركة الشفاه بالصوت، والحفاظ على ملامح الوجه الطبيعية، بالإضافة إلى إنشاء حركات واقعية للشخص في أثناء الاستماع.وتسعى الشركة من خلال نموذج INFP إلى تطويره ليعمل مع النصوص والصور وليست الصوت فقط، بالإضافة إلى تطوير تقنيات لتحريك الجسم كاملًا، وليس الاكتفاء بالرأس.(وكالات)