تحليل المشاعر: الفرق بين النسختين

[نسخة منشورة][نسخة منشورة]
تم حذف المحتوى تمت إضافة المحتوى
←‏أنظمة تحليل آراء متعددة اللغات: حذف جزء غير موسوعي (يبدو كأنه ورقة بحثية أو مقالة)
سطر 20:
 
ولتطوير هذه الأنظمة، استخدم الباحثون العديد من الطرق منها: استخدام قواعد اللغة المحلية، والميزات الموضعية، وأنماط المشاعر الحاملة، وسلاسل الكلمات، وتعليم مواضع الكلمات، وتحليل التبعية.
 
==== <span lang="ar" dir="ltr">أنظمة إسترجاع المعلومات والمصنفات والمجمعات</span> ====
<span lang="ar" dir="ltr">هذا الجزء يعرض اثنين من أنظمة تحليل الآراء التي استخدمت نظم استرجاع المعلومات والمصنفات والمجمعات .</span>
 
<span lang="ar" dir="ltr">عرض الحواري والإفكي</span><ref>محمد الحواري ومحمد الإفكي، تحليل الآراء العربية للأعمال. في ورشة عمل مؤتمر إتحاد مهندسي الكهرباء والإلكترونيات العالمية لتحليل البيانات 2010. ص 1108-1113. إتحاد مهندسي الكهرباء والإلكترونيات العالمية. 2010 (باللغة الإنجليزية).</ref> <span lang="ar" dir="ltr">نظاماً لتحليل آراء الأعمال العربية باستخدام مصنفين ، الاول لبناء بيانات التدريب <span lang="ar" dir="rtl">(Training Data) من خلال تصنيف مجموعة من بيانات الشبكة العنكبوتية(Web) الى آراء و غير آراءثم مصنف تعزيز التكيف (AdaBoost Classifier)استخدم لتصنيف النصوص الى مستندات تحتوي على اراء باللغة العربية واخرى غير ذلك . ثم تم استخدام معجم لتحليل الآراء الذي تم بناؤه من الصفر واحتوى على اراء ايجابية واخرى سلبية مرتبين حسب درجاتهم. هذا المعجم استخدم كنواة لرسم التشابه(Similarity Graph ) في رسم التشابه كل كلمتين متشابهتين بينهما حافة. تم اضافة الكلمات الاكثر شيوعاً على الشبكة العنكبوتية لهذه النواة ايضاً . تم اختبار هذا النظام بإستخدام 650 كلمة او مصطلح عشوائياً وحل على دقة عالية (Precision) لكن نسبة استرجاع (Recall) ضعيفة . استخدم ابو جبرا</span></span> <ref>أمجد أبو جبارة وبين كينج ومنى ذياب ودراغومير راديف. تعريف مجموعات الآراء الجزئية في النقاشات العربية الحية. جمعية اللغات المحوسبة ، صفحات 829--835، 2013 (باللغة الانجليزية).</ref><span lang="ar" dir="ltr"><span lang="ar" dir="rtl">طرق معالجة اللغة العربية الطبيعية لتحليل آراء النقاشات . أبو جبرا بدأ بالتحليل على مستوى الكلمة حيث تم تحديد قطبية كل كلمة بالاعتماد على معجم عواطف</span></span> <ref>محمد عبد المجيد ومنى ذياب. عواطف: مجمع متعدد الانواع لتحليل الاراء في اللغة العربية الفصحى الحديثة. المؤتمر العالمي لمصادر وتقييم اللغة، صفحات 3907--3914 ، 2012 .(باللغة الانجليزية).</ref><span lang="ar" dir="ltr"><span lang="ar" dir="rtl">اما قطبية الكلمة في السياق فتم تحديدها بالاعتماد على نظام سمر</span></span> <ref name=":2">محمد عبد المجيد وساندرا كوبلير ومنى ذياب.سمر: نظام لتحليل الاراء في الاعلام الاجتماعي العربي. محضر ورشة عمل الثالثة في الطرق المحوسبة لتحليل الاراء، صفحات 19--28. إتحاد علوم اللغة المحوسبة، 2012. (باللغة الانجليزية).</ref><span lang="ar" dir="ltr"><span lang="ar" dir="rtl">في المرحلة اللاحقة تم تحديد هدف القطبية حيث تم توسيم اي كلمة ظهرت في نصين او اكثر بهدف القطبية. تم تمثيل توزيع المواضيع لكل مناقش بمتجه ذي ن من الحدود حيث ن هي عدد المواضيع ، في المرحلة التالية تم تطبيق تخصيص ديريتشليت الكامن (LDA) على كل واحد من المواضيع. هذا التمثيل يعتمد على حقيقة انه اذا اتفق شخصان على نفس الرأي فإنهما غالباً سيكون لديهم نفس الاهتمام بالمواضيع. لإيجاد المجموعات الجزئية للآراء تم استخدام طرق تجميع المتجهات (Vector Space Clustering) تم تمثيل مواضيع المناقشين ايضا كشبكة معلمة (Signed Network) حيث ان كل نقطة في هذا الشبكة تمثل مناقشاً ولكل نقطتين في وصلة ايجابية اذا كان عدد المواضيع الذين اتفقوا عليها أكبر من عدد اللواتي اختلفوا عليها ووصلة سلبية اذا كان عدد اللواتي اختلفوا عليها اكبر اما اذا لم يكن هناك اهتمام مشترك بنفس المواضيع فهما غير متصلتان.تم اختبار التمثيل المتجهي باستخدام مجمع ك-معدل([[:en:K-means_clustering|K-Means]]) وبإستخدام مجمع الأبعد أولاً (Farthest First) وبإستخدام توقع التجزيئ الأقصى ([[:en:Expectation–maximization_algorithm|Maximization Expectation]]) بينما تم اختبار تمثيل الشبكة المعلمة باستخدام طريقة تجزيء الشبكات المعلمة(Signed Network Portioning) اظهرت النتائج ان طرق التجميع حصلت على اعلى نقاوة (Purity) واعلى مقياس فليشر ([[:en:F1_score|F- measure]]) وأفضل مقياس عشوائية ([[:en:Entropy|Entroby]]) هذه وحصل توقع التجزيئ الاقصى على افضل مقياس فليشر(0.76) وأعلى نقاوة (0.77) وأفضل عشوائية (0.5) كما ان النتائج أظهرت ان عدد اهداف الرأي والتحليل الدلالي للكلمة ([[:en:Latent_semantic_analysis|Latent Similarity Analysis]]) هما خاصيتان مهمتان.</span></span>
 
=== تحليل الآراء بإستخدام ميزات خاصة باللغة العربية ===