إم بي 3: الفرق بين النسختين

تم إضافة 10٬437 بايت ، ‏ قبل 8 أشهر
ط (بوت:إزالة تصنيف عام (3.8) إزالة تصنيف:صوت رقمي لوجود (تصنيف:ضغط بيانات)))
وسمان: تمت إضافة وسم nowiki تحرير مرئي
== تاريخ ونشأته ==
إم بي 3 أو (MPEG1 أو MPEG2, مع Layer 3) عبارة عن ملف ذو تركيبة رقمية تم تصغير حجمها (بالضغط) بشكل كبير حتى يمكن تنزيل ذلك الملف بوقت أقل، من ال[[إنترنت]]. وهذا الضغط لا يؤثر على جودة الصوت مادامت الجودة تحددها أذن الإنسان. هذه التركيبة تجعل مستعمليها قادرين على تخزينها في أجهزتهم دون أن تستهلك مساحة كبيرة من القرص الصلب وكذلك تحميلها عبر شبكة الإنترنت أو تنزيلها من الشبكة أو حتى إرسالها بالبريد الإلكتروني لأصحابهم.
 
=== خلفية ===
تستفيد خوارزمية ضغط البيانات الصوتية المفقودة في ملفات إم بي 3 من القيود الإدراكية للسمع البشري والتي تسمى الإخفاء السمعي (Auditory masking). في عام 1894 ذكر الفيزيائي الأمريكي ألفرد إم. ماير (Alfred M. Mayer) أنه يمكن جعل نغمة غير مسموعة بواسطة نغمة أخرى ذات تردد أقل.<ref>{{استشهاد بدورية محكمة|title=XXIII. Researches in Acoustics.—No. IX|url=https://doi.org/10.1080/14786449408620544|journal=The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science|date=1894-03-01|issn=1941-5982|pages=259–288|volume=37|issue=226|DOI=10.1080/14786449408620544|first=Alfred M. Mayer|last=Ph.D}}</ref> في عام 1959، وصف ريتشارد إهمرRichard) Ehmer) مجموعة كاملة من المنحنيات السمعية بخصوص هذه الظاهرة.<ref>{{استشهاد بدورية محكمة|title=Masking by Tones vs Noise Bands|url=http://adsabs.harvard.edu/abs/1959ASAJ...31.1253E|journal=Acoustical Society of America Journal|date=1959|issn=0001-4966|pages=1253|volume=31|DOI=10.1121/1.1907853|first=Richard H.|last=Ehmer}}</ref> بين عامي 1967 و 1974، عمل إيبرهارد زويكر (Eberhard Zwicker) في مجالات ضبط وإخفاء نطاقات التردد الحرجة،<ref>{{استشهاد بكتاب|title=Facts and Models in Hearing : Proceedings of the Symposium on Psychophysical Models and Physiological Facts in Hearing, held at Tutzing, Oberbayern, Federal Republic of Germany, April 22-26, 1974|url=https://www.worldcat.org/oclc/858929505|publisher=Springer Berlin Heidelberg|date=1974|place=Berlin, Heidelberg|ISBN=978-3-642-65902-7|OCLC=858929505|author1=Eberhard}}</ref><ref>{{استشهاد ويب
| url = https://web.archive.org/web/20000914080525/http://asa.aip.org/books/ear.html
| title = The Ear as a Communication Receiver
| date = 2000-09-14
| website = web.archive.org
| accessdate = 2021-02-13
}}</ref> والتي بُنيَت بدورها على البحث الأساسي في المنطقة من هارفي فليتشر (Harvey Fletcher) ومعاونيه في مختبرات بِل (Bell Labs). <ref>{{استشهاد بكتاب|title=The ASA edition of Speech and hearing in communication|url=https://www.worldcat.org/oclc/31783000|publisher=Acoustical Society of America|date=1995|place=Woodbury, NY|ISBN=1-56396-393-0|OCLC=31783000|author1=Harvey}}</ref>
 
استُخدِم الترميز الإدراكي لأول مرة لضغط ترميز الكلام باستخدام [[ترميز تنبؤي خطي|الترميز التنبؤي الخطي]]، والذي نشأ في أعمال فوميتادا إيتاكورا (Fumitada Itakura) (جامعة ناغويا) وشوزو سايتو (Shuzo Saito) (إن تي تي) في عام 1966.<ref>{{Cite web
| url = https://ee.stanford.edu/~gray/lpcip.pdf
| title = Linear Predictive Coding and theInternet ProtocolA survey of LPC and a History of of RealtimeDigital Speech on Packet Networks
| date =
| website =
| publisher =
| accessdate =
| last =
| first =
}}</ref> في عام 1978، اقترح كل من بيشنو إس. أتال (Bishnu S. Atal) ومانفريد آر. شرودر (Manfred R. Schroeder) من مختبرات بل [[المرمز مزيل الترميز|كوديك]] كلام [[ترميز تنبؤي خطي|الترميز التنبؤي الخطي]]، يُسمى الترميز التنبؤي التكيفي (Adaptive predictive coding)، والذي يستخدم خوارزمية تشفير صوتية نفسية تستغل خصائص إخفاء الأذن البشرية.<ref>{{استشهاد بكتاب|title=Acoustics, information, and communication : memorial volume in honor of Manfred R. Schroeder|url=https://www.worldcat.org/oclc/884964544|date=2014|place=Cham|ISBN=978-3-319-05660-9|OCLC=884964544}}</ref><ref>{{استشهاد بدورية محكمة|title=Predictive coding of speech signals and subjective error criteria|url=https://www.academia.edu/21164608/Predictive_coding_of_speech_signals_and_subjective_error_criteria|journal=ICASSP &#39;78. IEEE International Conference on Acoustics, Speech, and Signal Processing|language=en|first=Bishnu|last=Atal}}</ref> كان هناك مزيد من التحسين من قبل شرودر وأتال مع جيه إل هول (J.L. Hall) أُبلِغ عنه لاحقًا في ورقة عام 1979.<ref>{{استشهاد بدورية محكمة|title=Optimizing digital speech coders by exploiting masking properties of the human ear|url=https://asa.scitation.org/doi/10.1121/1.383662|journal=The Journal of the Acoustical Society of America|date=1979-12-01|issn=0001-4966|pages=1647–1652|volume=66|issue=6|DOI=10.1121/1.383662|first=M. R.|last=Schroeder|first2=B. S.|last2=Atal|first3=J. L.|last3=Hall}}</ref> في نفس العام، اقتُرِح ترميز إخفاء صوتي نفسي بواسطة إم إيه كراسنر (M.A. Krasner)،<ref>{{استشهاد بأطروحة|title=Digital encoding of speech and audio signals based on the perceptual requirements of the auditory system|url=https://dspace.mit.edu/handle/1721.1/16011|publisher=Massachusetts Institute of Technology|date=1979|degree=Thesis|first=Michael Allen|last=Krasner}}</ref> الذي نشر وأنتج أجهزة للكلام، ولكن نشر نتائجه في تقرير فني لمختبر لينكولن (Lincoln Laboratory) غامض نسبيًا <ref>{{استشهاد ويب
| url = https://web.archive.org/web/20170903070321/https://www.dtic.mil/dtic/tr/fulltext/u2/a077355.pdf
| title = Wayback Machine
| date = 2017-09-03
| website = web.archive.org
| accessdate = 2021-02-13
}}</ref> لم يؤثر على الفور على الاتجاه السائد لتطوير الترميز النفسي الصوتي.
 
طُوِّر [[تحويل جيب التمام المتقطع]] (DCT)، وهو نوع من ترميز التحويل لل<nowiki/>[[ضغط فقود|ضغط الفقود]]، والذي اقترحه ناصر أحمد في عام 1972، بواسطة أحمد مع تي. ناتاراجان (T. Natarajan) وك. ر. راو (K.R Rao) في عام 1973، وقد نشروا نتائجهم في عام 1974.<ref>{{استشهاد بدورية محكمة|title=How I came up with the discrete cosine transform|url=https://www.sciencedirect.com/science/article/pii/105120049190086Z|journal=Digital Signal Processing|date=1991-01-01|issn=1051-2004|pages=4–5|volume=1|issue=1|DOI=10.1016/1051-2004(91)90086-Z|language=en|first=Nasir|last=Ahmed}}</ref><ref>{{Cite web
| url = https://dl.acm.org/doi/10.1109/T-C.1974.223784
| title = Discrete Cosine Transfom
| date =
| website =
| publisher =
| accessdate =
| last =
| first =
}}</ref><ref>{{استشهاد بكتاب|title=Discrete cosine transform : algorithms, advantages, applications|url=https://www.worldcat.org/oclc/20670551|publisher=Academic Press|date=1990|place=Boston|ISBN=0-12-580203-X|OCLC=20670551|author1=K. Ramamohan}}</ref> أدى ذلك إلى تطوير تحويل جيب التمام المتقطع المُعدَّل (MDCT)، الذي اقترحه جي بي برينسنJ.P) Princen) وجونسون (A.W. Johnson) وأ. ب. برادلي (A.B. Bradley) في عام 1987، بعد عمل سابق قام به برينسن وبرادلي في عام 1986.<ref>{{Cite web
| url = https://jglobal.jst.go.jp/en/detail?JGLOBAL_ID=200902061990795003
| title = Subband/transform coding using filter bank designs based on time domain aliasing cancellation.
| date =
| website =
| publisher =
| accessdate =
| last =
| first =
}}</ref> أصبح تحويل جيب التمام المتقطع المُعدَّل لاحقًا جزءًا أساسيًا من خوارزمية إم بي 3. <ref>{{Cite web
| url = http://www.math.utah.edu/~gustafso/s2012/2270/web-projects/Guckert-audio-compression-svd-mdct-MP3.pdf
| title = The Use of FFT and MDCT in MP3 Audio Compression
| date =
| website =
| publisher =
| accessdate =
| last =
| first =
}}</ref>
 
قام إرنست تيرهاردت (Ernst Terhardt) وآخرون بإنشاء خوارزمية تصف إخفاء السمع بدقة عالية في عام 1982.<ref>{{استشهاد بدورية محكمة|title=Algorithm for extraction of pitch and pitch salience from complex tonal signals|url=https://asa.scitation.org/doi/10.1121/1.387544|journal=The Journal of the Acoustical Society of America|date=1982-03-01|issn=0001-4966|pages=679–688|volume=71|issue=3|DOI=10.1121/1.387544|first=Ernst|last=Terhardt|first2=Gerhard|last2=Stoll|first3=Manfred|last3=Seewann}}</ref> أضاف هذا العمل إلى مجموعة متنوعة من التقارير من المؤلفين الذين يعود تاريخهم إلى فليتشر، وإلى العمل الذي حدد في البداية النسب الحرجة وعرض النطاق الترددي الحرج.
 
في عام 1985، قدم أتال وشرودر تنبؤًا خطيًا متحمسًا بالشفرة (CELP)، وهو عبارة عن خوارزمية لترميز الكلام الإدراكي القائم على [[ترميز تنبؤي خطي|الترميز التنبؤي الخطي]] مع إخفاء سمعي حقق نسبة ضغط بيانات كبيرة في وقته.<ref>{{استشهاد بكتاب|title=Acoustics, information, and communication : memorial volume in honor of Manfred R. Schroeder|url=https://www.worldcat.org/oclc/884964544|date=2014|place=Cham|ISBN=978-3-319-05660-9|OCLC=884964544}}</ref> ذكرت مجلة معهد مهندسي الكهرباء والإلكترونيات (وهي مجلة محكمة حول مجالات مختارة في الاتصالات) مجموعة واسعة من خوارزميات ضغط الصوت (الإدراكية في الغالب) في عام 1988. أفادت طبعة "الترميز الصوتي للاتصالات" التي نُشرت في فبراير 1988 عن مجموعة واسعة من تقنيات ضغط بتات الصوت الراسخة والعاملة،<ref>"Voice Coding for Communications". IEEE Journal on Selected Areas in Communications. 6 (2). February 1988.</ref> يستخدم بعضها إخفاءً سمعيًا كجزء من تصميمها الأساسي، ويُظهِر العديد منها تطبيقات الأجهزة في الوقت الفعلي.
 
== قبل ظهور إم بي 3 ==