بنية زمنية دقيقة

الغلاف الزمني (إي إن في) والبنية الدقيقة الزمنية (تي إف إس) هما التغيرات التي يدركها الإنسان في سعة الصوت وتردده مع مرور الزمن. تُعتبر هذه التغيرات الزمنية مسؤولة عن العديد من الجوانب ذات الصلة بالإدراك السمعي، بما في ذلك إدراك الجهارة، والحدة والجرس والسمع المكاني.

يعمل جهاز السمع المحيطي لدى الإنسان على تفكيك الأصوات المعقدة مثل الكلام أو الموسيقا إلى نطاقات ضيقة التردد. تستطيع الإشارات الناتجة ضيقة النطاق إيصال المعلومات في نطاقات زمنية مختلفة متراوحة بين ما يقل عن الميلي ثانية وما يفوق مئات الميلي ثانية. اقتُرح وجود ثنائية بين إشارات «الغلاف الزمني» البطيئة وإشارات «البنية الدقيقة الزمنية» الأسرع عند دراسة الجوانب العديدة من الإدراك السمعي (على سبيل المثال، إدراك الجهارة، والحدة والجرس، وتحليل المشهد السمعي، وموضعة الصوت) ضمن مقياسين زمنيين منفصلين لكل من نطاقي التردد.[1][2][3][4][5][6][7] على مر العقود الماضية، نشأت ثروة من الدراسات النفسية الفيزيائية، والفيزيولوجية الكهربائية والحاسوبية القائمة على ثنائية الغلاف / البنية الدقيقة، إذ اختبرت هذه الدراسات دور الإشارات الزمنية في تحديد الصوت والتواصل، وكيفية معالجة هذه الإشارات الزمنية بواسطة الجهاز السمعي المركزي والمحيطي بالإضافة إلى تأثيرات الشيخوخة وتلف القوقعة على المعالجة السمعية الزمنية. على الرغم من اعتبار ثنائية الغلاف / البنية الدقيقة موضعًا للجدل واستمرار التساؤلات حول كيفية تشفير إشارات البنية الدقيقة الزمنية في الجهاز السمعي، أدت هذه الدراسات إلى مجموعة من التطبيقات في مختلف المجالات بما في ذلك معالجة الصوت والكلام، وعلم السمع السريري وإعادة تأهيل حالات الصمم الحسي العصبي بواسطة المعينات السمعية أو زراعة القوقعة.

تعريف

عدل

قد تمتلك مفاهيم الغلاف الزمني والبنية الدقيقة الزمنية معان مختلفة في الدراسات المختلفة. تتمثل إحدى الأمور التي يجب النظر فيها في التمييز بين الوصف الفيزيائي (أي الصوتي) والوصف الحيوي (أي الإدراكي) لإشارات «إي إن في» و«تي إف إس».

يمكن اعتبار الصوت الذي تغطي مكونات تردده نطاقًا ضيقًا (إذ يُطلق على هذا الصوت اسم إشارة ضيقة النطاق) بمثابة غلاف («إي إن في بّي»، إذ تمثل «بّي» الإشارة الفيزيائية) متراكب على حامل متذبذب بسرعة أكبر، الذي يمثل البنية الدقيقة الزمنية (تي إف إس بّي).[8]

تُعتبر غالبية الأصوات في الحياة اليومية، بما في ذلك الكلام والموسيقا، واسعة النطاق؛ تنتشر مكونات التردد على نطاق واسع مع عدم وجود طريقة دقيقة بما يكفي لتمثيل الإشارة بالنسبة إلى «إي إن في بّي» و«تي إف إس بّي». مع ذلك، يمكن تفكيك الإشارات المعقدة واسعة النطاق في القوقعة السليمة وظيفيًا من خلال فلترتها على الغشاء القاعدي (بي إم) داخل القوقعة إلى سلسلة من الإشارات ضيقة النطاق.[9] نتيجة لذلك، يمكن اعتبار شكل الموجة في كل مكان على الغشاء القاعدي بمثابة غلاف (إي إن في بي إم) متراكب على حامل متذبذب بسرعة أكبر، الذي يمثل البنية الدقيقة الزمنية (تي إف إس بي إم).[10] يستند كل من «إي إن في بي إم» و«تي إف إس بي إم» إلى المكان على طول الغشاء القاعدي. في النهاية الذروية المضبوطة على ترددات (صوتية) منخفضة، يختلف كل من «إي إن في بي إم» و«تي إف إس بي إم» ببطء نسبيًا مع مرور الزمن، بينما يختلفان بشكل أسرع مع مرور الزمن في النهاية القاعدية المضبوطة على ترددات عالية. [10]

يحدث تمثيل كل من «إي إن في بي إم» و«تي إف إس بي إم» في الأنماط الزمنية لجهود الفعل في العصب السمعي إذ يمكن الإشارة إليها بواسطة «إي إن في إن» و«تي إف إس إن».[11] يحدث تمثيل «تي إف إس إن» بشكل سائد في العصبونات المضبوطة على الترددات المنخفضة، بينما يحدث تمثيل «إي إن في إن» بشكل سائد في العصبونات المضبوطة على الترددات (الصوتية) المرتفعة.[11][12] بالنسبة إلى الإشارة واسعة النطاق، يتعذر التأثير على «تي إف إس بّي» دون التأثير أيضًا على «إي إن في بي إم» و«إي إن في إن»، ومن غير الممكن التأثير على «إي إن في بّي» دون التأثير أيضًا على «تي إف إس بي إم» و«تي إف إس إن»[13][14]

الدور في الكلام وإدراك الموسيقا

عدل

دور الغلاف الزمني في الكلام وإدراك الموسيقا

عدل

تلعب «إي إن في بّي» دورًا في العديد من الجوانب المتعلقة بالإدراك السمعي، بما في ذلك إدراك الكلام والموسيقا.[2][7][15][16] يصبح التعرف على الكلام ممكنًا باستخدام إشارات «إي إن في بّي»، حتى في حالات التراجع الكبير للمعلومات الطيفية و«تي إف إس بّي».[17] في الواقع، عند دمج «تي إف إس بّي» من جملة واحدة مع «إي إن في بّي» من جملة لاحقة، يمكن عندئذ سماع كلمات الجملة الثانية فقط. تتمثل معدلات «إي إن في بّي» ذات الأهمية الأكبر للكلام في تلك التي تقل عن 16 هرتز، المتوافقة مع التقلبات في معدل المقاطع الصوتية.[18] من ناحية أخرى، ينتقل محيط التردد الأساسي («الحدة») لأصوات الكلام بشكل أساسي عبر إشارات «تي إف إس بّي»، على الرغم من إمكانية إدراك بعض المعلومات على المحيط بواسطة تقلبات الغلاف السريعة المتوافقة مع التردد الأساسي.[19][20][21] بالنسبة إلى الموسيقا، تنقل معدلات «إي إن في بّي» البطيئة معلومات الإيقاع وسرعة الإيقاع، بينما تنقل المعدلات الأسرع خصائص بدء الصوت ومعادلته (المقدمة والاضمحلال، على الترتيب) الهامة من أجل إدراك الجرس.[22]

دور البنية الدقيقة الزمنية في الكلام وإدراك الموسيقا

عدل

تلعب القدرة على المعالجة الدقيقة لمعلومات «تي إف إس بّي»، كما يُعتقد، دورًا في إدراكنا للحدة (أي الارتفاع المدرك للأصوات)، إذ يمثل ذلك أحد الأحاسيس الهامة للإدراك الموسيقي، بالإضافة إلى قدرتنا على فهم الكلام، وخاصة في وجود ضجيج خلفي.  [4]

دور البنية الدقيقة الزمنية في إدراك الحدة

عدل

على الرغم من استمرار الجدل حول آليات استعادة الحدة وتذكرها في الجهاز السمعي،[23][24] يمكن استخدام معلومات «تي إف إس إن» في استعادة حدة النغمات الصافية منخفضة التردد وتقدير الترددات الفردية للتوافقيات منخفضة العدد (بين الأولى والثامنة تقريبًا) للأصوات المعقدة،[25][26] أي الترددات التي يمكن من خلالها استعادة التردد الأساسي للصوت وفقًا لنماذج متطابقة الأنماط من إدراك الحدة،[27] على سبيل المثال. اقتُرح أيضًا وجود دور لمعلومات «تي إف إس إن» في إدراك حدة الأصوات المعقدة المتضمنة توافقيات متوسطة (بين السابعة والسادسة عشرة تقريبًا)[28] ومن الممكن تبريره بواسطة النماذج الزمنية أو الطيفية الزمنية لإدراك الحدة.[29] قد تكون إشارات «تي إف إس إن» المتراجعة المنقولة بواسطة أجهزة زراعة القوقعة مسؤولة جزئيًا عن الإدراك الموسيقي المضطرب لدى متلقي زراعة القوقعة.[30]

دور إشارات البنية الدقيقة الزمنية في إدراك الكلام

عدل

يُعتقد أن إشارات «تي إف إس بّي» هامة من أجل تحديد المتكلمين بالإضافة إلى تحديد النغمة في اللغات النغمية.[31] علاوة على ذلك، أشارت العديد من دراسات المشفر الصوتي إلى مساهمة إشارات «تي إف إس بّي» في وضوح الكلام في حالتي السكون والضجيج.[32] على الرغم من صعوبة عزل إشارات «تي إف إس بّي» عن إشارات «إي إن في بّي»،[16][33] تشير أدلة الدراسات على المستمعين ضعاف السمع إلى أن قدرتهم على إدراك الكلام مع وجود ضجيج خلفي عائدة جزئيًا إلى قدرتهم على معالجة «تي إف إس بّي» بشكل دقيق،[34][35] على الرغم من عدم اعتماد قدرة «الاستماع في الانخفاضات» لحاجبات التقلب على إشارات «تي إف إس بّي» الدورية.[36]

المراجع

عدل
  1. ^ Viemeister NF، Plack CJ (1993). Human Psychophysics. Springer Handbook of Auditory Research. Springer, New York, NY. ص. 116–154. DOI:10.1007/978-1-4612-2728-1_4. ISBN:978-1-4612-7644-9.
  2. ^ ا ب Rosen S (يونيو 1992). "Temporal information in speech: acoustic, auditory and linguistic aspects". Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences. ج. 336 ع. 1278: 367–73. Bibcode:1992RSPTB.336..367R. DOI:10.1098/rstb.1992.0070. PMID:1354376.
  3. ^ Drullman R (يناير 1995). "Temporal envelope and fine structure cues for speech intelligibility". The Journal of the Acoustical Society of America. ج. 97 ع. 1: 585–92. Bibcode:1995ASAJ...97..585D. DOI:10.1121/1.413112. PMID:7860835.
  4. ^ ا ب Moore BC (ديسمبر 2008). "The role of temporal fine structure processing in pitch perception, masking, and speech perception for normal-hearing and hearing-impaired people". Journal of the Association for Research in Otolaryngology. ج. 9 ع. 4: 399–406. DOI:10.1007/s10162-008-0143-x. PMC:2580810. PMID:18855069.
  5. ^ De Boer E (سبتمبر 1956). "Pitch of inharmonic signals". Nature. ج. 178 ع. 4532: 535–6. Bibcode:1956Natur.178..535B. DOI:10.1038/178535a0. PMID:13358790. S2CID:4241424.
  6. ^ Zeng FG، Nie K، Liu S، Stickney G، Del Rio E، Kong YY، Chen H (سبتمبر 2004). "On the dichotomy in auditory perception between temporal envelope and fine structure cues". The Journal of the Acoustical Society of America. ج. 116 ع. 3: 1351–4. Bibcode:2004ASAJ..116.1351Z. DOI:10.1121/1.1777938. PMID:15478399. مؤرشف من الأصل في 2022-10-17.
  7. ^ ا ب Plomp R (1983). "Perception of speech as a modulated signal". Proceedings of the 10th International Congress of Phonetic Sciences, Utrecht: 19–40.
  8. ^ Hilbert D (1912). Grundzüge einer allgemeinen theorie der linearen integralgleichungen. University of California Libraries. Leipzig, B. G. Teubner. مؤرشف من الأصل في 2022-06-29.
  9. ^ Ruggero MA (يوليو 1973). "Response to noise of auditory nerve fibers in the squirrel monkey". Journal of Neurophysiology. ج. 36 ع. 4: 569–87. DOI:10.1152/jn.1973.36.4.569. PMID:4197339. مؤرشف من الأصل في 2022-01-20.
  10. ^ ا ب Moore BC (4 مايو 2014). Auditory Processing of Temporal Fine Structure: Effects of Age and Hearing Loss. New Jersey: World Scientific Publishing Company. ISBN:9789814579650.
  11. ^ ا ب Joris PX، Louage DH، Cardoen L، van der Heijden M (يونيو 2006). "Correlation index: a new metric to quantify temporal coding". Hearing Research. 216–217: 19–30. DOI:10.1016/j.heares.2006.03.010. PMID:16644160. S2CID:32416471.
  12. ^ Heinz MG، Swaminathan J (سبتمبر 2009). "Quantifying envelope and fine-structure coding in auditory nerve responses to chimaeric speech". Journal of the Association for Research in Otolaryngology. ج. 10 ع. 3: 407–23. DOI:10.1007/s10162-009-0169-8. PMC:3084379. PMID:19365691.
  13. ^ Søndergaard PL، Decorsière R، Dau T (15 ديسمبر 2011). "On the relationship between multi-channel envelope and temporal fine structure". Proceedings of the International Symposium on Auditory and Audiological Research. ج. 3: 363–370. مؤرشف من الأصل في 2022-12-04.
  14. ^ Shamma S، Lorenzi C (مايو 2013). "On the balance of envelope and temporal fine structure in the encoding of speech in the early auditory system". The Journal of the Acoustical Society of America. ج. 133 ع. 5: 2818–33. Bibcode:2013ASAJ..133.2818S. DOI:10.1121/1.4795783. PMC:3663870. PMID:23654388.
  15. ^ Van Tasell DJ، Soli SD، Kirby VM، Widin GP (أكتوبر 1987). "Speech waveform envelope cues for consonant recognition". The Journal of the Acoustical Society of America. ج. 82 ع. 4: 1152–61. Bibcode:1987ASAJ...82.1152V. DOI:10.1121/1.395251. PMID:3680774.
  16. ^ ا ب Ghitza O (سبتمبر 2001). "On the upper cutoff frequency of the auditory critical-band envelope detectors in the context of speech perception". The Journal of the Acoustical Society of America. ج. 110 ع. 3 Pt 1: 1628–40. Bibcode:2001ASAJ..110.1628G. DOI:10.1121/1.1396325. PMID:11572372.
  17. ^ Shannon RV، Zeng FG، Kamath V، Wygonski J، Ekelid M (أكتوبر 1995). "Speech recognition with primarily temporal cues". Science. ج. 270 ع. 5234: 303–4. Bibcode:1995Sci...270..303S. DOI:10.1126/science.270.5234.303. PMID:7569981. S2CID:581599.
  18. ^ Smith ZM، Delgutte B، Oxenham AJ (مارس 2002). "Chimaeric sounds reveal dichotomies in auditory perception". Nature. ج. 416 ع. 6876: 87–90. Bibcode:2002Natur.416...87S. DOI:10.1038/416087a. PMC:2268248. PMID:11882898.
  19. ^ Drullman R، Festen JM، Plomp R (فبراير 1994). "Effect of temporal envelope smearing on speech reception". The Journal of the Acoustical Society of America. ج. 95 ع. 2: 1053–64. Bibcode:1994ASAJ...95.1053D. DOI:10.1121/1.408467. PMID:8132899.
  20. ^ Varnet L، Ortiz-Barajas MC، Erra RG، Gervain J، Lorenzi C (أكتوبر 2017). "A cross-linguistic study of speech modulation spectra" (PDF). The Journal of the Acoustical Society of America. ج. 142 ع. 4: 1976–1989. Bibcode:2017ASAJ..142.1976V. DOI:10.1121/1.5006179. PMID:29092595. S2CID:25269485. مؤرشف من الأصل (PDF) في 2022-03-26.
  21. ^ Singh NC، Theunissen FE (ديسمبر 2003). "Modulation spectra of natural sounds and ethological theories of auditory processing". The Journal of the Acoustical Society of America. ج. 114 ع. 6 Pt 1: 3394–411. Bibcode:2003ASAJ..114.3394S. DOI:10.1121/1.1624067. PMID:14714819.
  22. ^ Iverson P، Krumhansl CL (نوفمبر 1993). "Isolating the dynamic attributes of musical timbre". The Journal of the Acoustical Society of America. ج. 94 ع. 5: 2595–603. Bibcode:1993ASAJ...94.2595I. DOI:10.1121/1.407371. PMID:8270737. S2CID:16374075. مؤرشف من الأصل في 2023-04-27.
  23. ^ Plack CJ (2005). Pitch - Neural Coding and Perception. Springer Handbook of Auditory Research. Springer. ISBN:9780387234724. مؤرشف من الأصل في 2018-02-10.
  24. ^ Cheveigné، Alain de (2005). "Pitch Perception Models". Pitch. Springer Handbook of Auditory Research. Springer, New York, NY. ج. 24. ص. 169–233. DOI:10.1007/0-387-28958-5_6. ISBN:9780387234724.
  25. ^ Moore B (5 أبريل 2013). An Introduction to the Psychology of Hearing: Sixth Edition (ط. 6th). Leiden: BRILL. ISBN:9789004252424.
  26. ^ Moore BC، Glasberg BR، Low KE، Cope T، Cope W (أغسطس 2006). "Effects of level and frequency on the audibility of partials in inharmonic complex tones". The Journal of the Acoustical Society of America. ج. 120 ع. 2: 934–44. Bibcode:2006ASAJ..120..934M. DOI:10.1121/1.2216906. PMID:16938981.
  27. ^ Terhardt E (مايو 1974). "Pitch, consonance, and harmony". The Journal of the Acoustical Society of America. ج. 55 ع. 5: 1061–9. Bibcode:1974ASAJ...55.1061T. DOI:10.1121/1.1914648. PMID:4833699.
  28. ^ Santurette S، Dau T (يناير 2011). "The role of temporal fine structure information for the low pitch of high-frequency complex tones". The Journal of the Acoustical Society of America. ج. 129 ع. 1: 282–92. Bibcode:2011ASAJ..129..282S. DOI:10.1121/1.3518718. PMID:21303009.
  29. ^ Santurette S، Dau T، Oxenham AJ (ديسمبر 2012). "On the possibility of a place code for the low pitch of high-frequency complex tones". The Journal of the Acoustical Society of America. ج. 132 ع. 6: 3883–95. Bibcode:2012ASAJ..132.3883S. DOI:10.1121/1.4764897. PMC:3528728. PMID:23231119.
  30. ^ Gfeller K، Turner C، Oleson J، Zhang X، Gantz B، Froman R، Olszewski C (يونيو 2007). "Accuracy of cochlear implant recipients on pitch perception, melody recognition, and speech reception in noise". Ear and Hearing. ج. 28 ع. 3: 412–23. DOI:10.1097/AUD.0b013e3180479318. PMID:17485990. S2CID:21933200.
  31. ^ Zeng FG، Nie K، Stickney GS، Kong YY، Vongphoe M، Bhargave A، Wei C، Cao K (فبراير 2005). "Speech recognition with amplitude and frequency modulations". Proceedings of the National Academy of Sciences of the United States of America. ج. 102 ع. 7: 2293–8. Bibcode:2005PNAS..102.2293Z. DOI:10.1073/pnas.0406460102. PMC:546014. PMID:15677723.
  32. ^ Lorenzi C، Gilbert G، Carn H، Garnier S، Moore BC (ديسمبر 2006). "Speech perception problems of the hearing impaired reflect inability to use temporal fine structure". Proceedings of the National Academy of Sciences of the United States of America. ج. 103 ع. 49: 18866–9. Bibcode:2006PNAS..10318866L. DOI:10.1073/pnas.0607364103. PMC:1693753. PMID:17116863.
  33. ^ Apoux F، Yoho SE، Youngdahl CL، Healy EW (سبتمبر 2013). "Role and relative contribution of temporal envelope and fine structure cues in sentence recognition by normal-hearing listeners". The Journal of the Acoustical Society of America. ج. 134 ع. 3: 2205–12. Bibcode:2013ASAJ..134.2205A. DOI:10.1121/1.4816413. PMC:3765279. PMID:23967950.
  34. ^ Strelcyk O، Dau T (مايو 2009). "Relations between frequency selectivity, temporal fine-structure processing, and speech reception in impaired hearing" (PDF). The Journal of the Acoustical Society of America. ج. 125 ع. 5: 3328–45. Bibcode:2009ASAJ..125.3328S. DOI:10.1121/1.3097469. PMID:19425674. S2CID:8062937. مؤرشف من الأصل (PDF) في 2022-03-26.
  35. ^ Hopkins K، Moore BC (يوليو 2011). "The effects of age and cochlear hearing loss on temporal fine structure sensitivity, frequency selectivity, and speech reception in noise". The Journal of the Acoustical Society of America. ج. 130 ع. 1: 334–49. Bibcode:2011ASAJ..130..334H. DOI:10.1121/1.3585848. PMID:21786903.
  36. ^ Freyman RL، Griffin AM، Oxenham AJ (أكتوبر 2012). "Intelligibility of whispered speech in stationary and modulated noise maskers". The Journal of the Acoustical Society of America. ج. 132 ع. 4: 2514–23. Bibcode:2012ASAJ..132.2514F. DOI:10.1121/1.4747614. PMC:3477190. PMID:23039445.