لأنه لا يوجد كلام من دون دماغ ينتجه ويسمعه ويفهمه، تتابع تقنيات الحوسبة الآلية (المؤتمَتَة) للكلام المنطوق Automated Speech Computing، عملها لإنتاج أدوات تنهض بها، كالمُحلّل الآلي (المؤتمَت) للكلام، الذي يسلّط الضوء على خصائص الإشارات الصوتيّة، وأحياناً يستطيع تحليل طريقة تحوّلها الى إحساس مفهوم في الدماغ، لكنه لا يستطيع الوصول إلى طريقة «فهم» معنى الكلام. إذ تنهض بالمهمة الأخيرة أدوات متخصّصة بها. ويُستَخْدَم هذا المُحلّل المؤتمَت للكلام، في نُظُم التعرّف الى الإشارات الصوتية وترميزها وتوليفها، إضافة الى استعماله في تطبيقات متخصّصة، كأن يساعد في تشخيص بعض الأمراض المتّصلة بالصوت، أو لدراسة اللغات. هوية الصوت تملك أدوات التعرّف الى الصوت ما يمكّنها من خوض مهمة فكّ شيفرة المعلومات التي تحملها إشارة الصوت. ويوجد نوعان من أدوات التعرّف الى الصوت، تسعى إحداها للتعرّف الى المُتكلّم وتحاول الاخرى فهم الكلام بحد ذاته. وفي التعرّف إلى المُتكلّم، نُفرّق بين تحديد هوية المُتَكلّم عندما ينطق بأحد النصوص من جهة، وتميّز صوت مُعيّن بين مجموعة من الأصوات المعروفة مسبقاً. وهناك فارق بين محاولة التعرّف آلياً إلى متكّلم مُفرد، وبين التعرّف إلى أصوات متنوّعة، إضافة إلى وجود آلات تتعرّف الى الصوت بصورته الخالصة، أي بغض النظر عن شكل الصوت. وتُدرّب الآلة على التعرّف إلى فرد أو مجموعة، حتى لو كان العدد كبيراً. وثمة أدوات للتعرّف المؤتمت الى الكلمات وفق كونها تنطق ككلمات منفصلة أو متّصلة. ومنذ فترة ليست بالقصيرة، انتشرت آلات تركيب الأصوات «سينثيسايزر» Synthesizers. ويؤدي وظيفة مُعاكِسة لأدوات التعرّف المؤتمت الى الكلام. وهناك نوعان أساسيان من أدوات انتاج الكلام آلياً. يعمل الأول على إنتاج الكلام بواسطة «الشكل» الرقمي للصوت، بعكس المُحلّل المؤتمت الذي تتمثل مهمته في إنتاج الكلام بالاستناد إلى خصائص الإشارات الصوتية، التي يجري الحصول عليها عبر عمليات تحليل الصوت بالآلات الرقمية. ويتتبّع النوع الثاني الكلام آلياً عبر التركيز على رموز الكلام. واستطراداً، هناك أدوات عدّة تندرج تحت هذا النوع، تشمل الناطق الآلي الذي يقرأ نصوصاً مكتوبة، والناطق الآلي الموجود داخل نُظُم الحوار بين الإنسان والآلات الذكيّة (مثل أدوات التشغيل عبر الأوامر الصوتية)، مع القدرّة على انتاج الكلام. ويعتمد عمل آلة مؤتمتة اخرى، هي «المُرَمّز» encoder، على تحويل خصائص الصوت وإشاراته إلى معادلات من الرياضيات. نُظُم مُعقّدة ولكن... تعطي أتمتة الصوت مثالاً ممتازاً عن دراسة النُظُم المُعقّدة، لأنها تثير أسئلة أساسية في مجال تجزئة نُظُم الكومبيوتر، واختيار وحدات التوصيف للإشارات الصوتية، وتقنيات محاكاة تجربة الكلام، والتوصّل إلى أتمتة المعرفة عبر كتابتها بطُرُق يقدر الكومبيوتر على «فهمها». كما تتصل أتمتة الصوت بالقدرات التقنية في مجال القراءة والتسلسل في فهم النصوص، وتقنيات قياس الجودة وتقدير الاحتمالات الإحصائية للتكرارات اللغوية وغيرها. ويمكن تحليل المعلومات المحمولة بإشارات الصوت عبر أساليب عدّة، تشمل علم الصوتيات «فونيتكس» Phonétiques، إضافة إلى الصرف والنحو والدلالة واستعمالات الكلام، وذبذبات الصوت وطُرُق تسجيلها على الحاسوب، والعلوم المتعلّقة بعضلات النطق والأوتار الصوتية وغيرها. واستطراداً، تتطلب هذه الأمور الاتفاق على معايير عالمية في تسجيل الصوت يتماشى مع المعيار العالمي للحروف الصوتية. وتشمل دراسة اللغة عِلم الأصوات الذي يعتبر مساحة تقاطع بين الصوت وتمثيله لغوّياً، كما تشمل دراسة ال «فونيم» Phoneme وهو أصغر وحدة صوتيّة تستعمل في توليف الكلمات. ويتضمّن الأمر أيضاً دراسة الشكل اللغوي للوحدات الصوتية الصغرى، ويُعرف باسم «مورفيم» Morpheme، ثم طرق تركيب هذه الأشياء في جُمَلٍ صحيحة، إضافة إلى دراسة طريقة نسج الجُمَل بما يؤدي إلى إعطائها معنى وسياقاً. واستطراداً، تجدر الإشارة الى انتشار هذه التقنيات في صناعة الهواتف الذكيّة. إذ توجد تطبيقات «آبليكايشنز» عدّة، متوافقة مع نُظُم «آبل» و «آندرويد»، لإملاء النصوص على الخليوي، مثل «فلنغو» Vlingo الذي ينقل نصوصاً صوتية إلى نصوصٍ مكتوبة، ويطبعها على ال «أس أم أس» وال «فايسبوك» و «تويتر» وغيرها. * إختصاصي لبناني في ألسنية الكومبيوتر