جدول تجزئة: الفرق بين النسختين

[نسخة منشورة][مراجعة غير مفحوصة]
تم حذف المحتوى تمت إضافة المحتوى
ط بوت: تفادي تحويلات القوالب
ط بوت: تفادي تحويلات القوالب
سطر 1:
{{وصلات قليلة|تاريخ=ينايرديسمبر 20142013}}
{{يتيمة|تاريخ=مارس 2009}}
في علوم الحاسب، '''جدول التقطيع''' هو بنية معطيات تربط مفاتيح بقيم.
تدعم هذه البنية العمليات المعجميّة(البحث, الإضافة و الحذف) بفعاليّة عالية, حيث يمكن القيام بكلِ من هذه العمليات باستخدام هذه البنية في زمن ثابت (O(1.
تعمل هذه البنية بتحويل المفتاح إلى قيمة عددية عادةً بوساطة تابع تقطيع.
 
المعروفة أيضا بـ:
== العمليات الأساسية ==
يعمل جدول التقطيع بتحويل المفتاح إلى [[قيمة عددية]] باستخدام تابع تقطيع, هذه القيمة العددية تحدد مكان العنصر الحامل للمفتاح المقابل لها, تختلف جودة تابع التقطيع باختلاف التطبيق الذي يستخدم الجدول فيه وباختلاف تابع التقطيع.
 
جداول هاش (جداول التقطيع) (خريطة هاش) (خريطة تقطيع) (قاموس هاش) (قاموس التقطيع)
بعض العمليات المعتادة على توابع التقطيع تتضمن الإدخال, الحذف و البحث, تنفذ كل هذه العملبات في وقت ثابت (بالكلفة)، مما يجعل استخدام هذه الجداول عملية فعالة جداً.
 
هو أحد بنى المعطيات في علم الحاسوب يملك خصائص المصفوفات الترابطية (associative array) ويمكن باستخدامه اسناد قيمة إلى مفتاح ما في ذاكرة الحاسب. والبحث عن قيم محددة بسرعة كبيرة مقارنة ببنى المعطيات الاخرى.
== معامل الحمل ==
أحد الخواص المهمة لجدول تقطيع ما هو نسبة امتلاء هذا الجدول, و هو نسبة عدد العناصر الموجودة في الجدول(n) إلى مساحة الجدول الكليّة (m).
و منه, يتضح تسمية النسبة (a=n/m) بمعامل الحمل.
معظم جداول التقطيع تربط الأداء الجيد ببقاء
عامل الحمل في مجال معين.
 
يستعمل جدول التقطيع، تابع تقطيع يمكنه من حساب مكان القيمة في لائحة المفاتيح.
== حل التصادمات ==
بما أن الهدف من التقطيع هو إيجاد قيمة وحيدة لكل مفتاح, فعندما يوجد تابع التقطيع القيمة ذاتها لأكثر من مفتاح فيجب إيجاد مكان بديل للمفتاح الجديد, عملية إيجاد مكان جديد تعرف ب: '''حل التصادمات'''، إن حل التصادمات يجب أن يكون ب[[خوارزمية]] محددة، أي أن يضمن أن البحث المستقبلي عن القيمة سيرد النتيجة الصحيحة.
 
في الحالة المثالية، يفترض بجدول التقطيع، ربط كل مفتاح بحجرة معينة، لكن في الواقع ذلك يجعل زمن البحث فيه عن القيم المتضاربة كبيراً جداً، لذلك تم إيجاد عدة حلول ونماذج لجداول التقطيع تم فيها افتراض وجود قيم متضاربة وتم تحسين زمن البحث فيها بشكل كبير.
[[تصنيف:علم الحاسوب]]
 
{{تنظيف}}
 
==جداول التقطيع ذات العنونة المباشرة (المفتوحة)==
العنونة المباشرة هي طريقة بسيطة التي تعمل كما يجب عندما المجموعة الكلية للمفاتيح U تكون صغيرة نسبيا لنفترض انه لتطبيق معين طلب مجموعة ديناميكية حيث ان لكل فرد في المجموعة اخذ مفتاح من {U={1,2,3,...,m-1 عندما m ليس عددا ضخما سنفترض ان المفاتيح الماخوذة مختلفة تماما.
جدول العنونة سنطبقها بواسطة مصطفة اي جداول العنونة مباشرة (directed adress table) سيكون [T[0,...,m-1 وكل مكان في الجدول يسمى خلية أو slot الذي يلائم مفتاحا من المجموعة الكلية إذا الجدول لم يحوِ أيّ مفتاح قيمته k حينها [nil=T[k
<source lang="freebasic">
direct-adress-search(T,k)
return T[k]
Direct-adress-insert(T,x)
T[key[x]]<-x
Direct-adress-delete(T,x)
T[key[x]]<-NIL
</source>
كل الخوارزميات في الأعلى سريعة وفعالة حيث ان كل منها يقوم بعدد قليل من العمليات (O(1
==جداول هاش==
الصعوبة في جداول العنونة المباشرة هي كبر المجموعة U حيث ان القيام بحفظ مصفوفة بحجم |U| غير واقعي وغير تطبيقي ومن ناحية أخرى قد تكون المجموعة K صغيرة كثيرا بالنسبة ل-U وعندها أغلب الأماكن في U ستكون حتما غير نافعة.
عندما تكون المجموعة K (القاموس) صغيرة جدا بالنسبة ل-U جدول هاش سيتطلب مكان اقل من جداول عنونة مباشرة اي سيتطلب جدول هاش (|O(|K بالرغم من أن بحث قيمة معينة في الجدول سيكون أيضا (O(1 المشكلة الوحيدة هو ان البحث في جدول الهاش هو متوقع بينما في العنونة المباشرة البحث هو (O(1 '''دائما'''
بالعنونة المباشرة حفظنا المفتاح k في الخلية k اما في الهاش فهذا المفتاح سوف يحفظ في (h(k اي اننا سوف نستخدم دالة هاش (hash function) لحساب الخلية التي سنحفظ فيها المفتاح k،
<source lang="freebasic">
h:U->{0,1,...,m-1}
</source>
نقول ان المفتاح k منقول(hashes)للخلية (h(k ; اي انه (h(k يسمى قيمة الهاش (hash value).
مشكلة من نوع اخر تظهر في الهاش وهي عندما يكون هناك مفتاحان k,t قيم الهاش خاصتهما متشابه اي : (h(t)=h(k
تسمى هذه الظاهرة بالتشابك في جدول الهاش أو collision ولهذه المشكلة يوجد حلول جيدة وفعالة.
قد يتبادر إلى الذهن حل عن طريق جعل h دالة عشوائية وساعتها سيكون هنالك اقل تشابك ولكن هذا الحل ليس طبيعي لاننا نريد الدالة h قطعية(deterministic)
الطريقة الأفضل لحل هذه المشكلة هي السلسلة (chaining) وهناك طريقة أخرى وهي العنونة المفتوحة (open addressing)
==حل مشكلة التشابك على طريق السلسلة==
في طريقة السلسلة (chaining) كل التشابكات في نفس الخلية نسلسلها بواسطة سلسلة
عند حل التشابكات بواسطة السلسلة من السهل ان نطبق عمليات الجدول T
<source lang="freebasic">
Chained-hash-Insert(T,x)
enter x in the haed of T[h(key(x))]
chained-hash-search(T,k)
search item with key value k in the list of T[h(k)]
chained-hash-delete(T,x)
delete x from T[h(key(x))]
</source>
عملية الإدخال تتم ب-(O(1 وقت اما البحث ففي الحالة الأسوأ يكون البحث (|[[O(|T[h[key ولكن في حالات الوسط يكون (O(1 اما الحذف (O(1 عندما تكون السلسلة ذو اتجاهين اما إذا كانت ذو اتجاه واحد عندها سيتطلب منا البحث اولا من ثم الحذف اي انه سيتطلب وقتا كما في البحث
==تحليل الهاش مع سلسلة==
عند إعطاءنا جدول T hg الذي يحوي على m خلايا و n قيم نعرف مقدم الكثافة(load factor) الخاص ب-T أو a=n/m اي معدل القيم المحفوظة في السلسلة الواحدة
في السيناريو الأسوأ فعالية الهاش مع سلسلة جدا سيئة : كل n المفاتيح موزعين لنفس الخلية ونكون سلسلة طويلة جدا والبحث عندها سيكون (O(n +الوقت المطلوب لحساب دالة الهاش وهو ليس بأفضل من البحث في سلاسل عادية
اما في السيناريو الوسط فعالية الهاش تقاس بمدى توزيع الدالة h للقيم بين المفاتيح سنفترض ان التوزيع سيكون بالتساوي اي ان الاحتمال بان قيمة معينة تذهب إلى مفتاح متساوية بين كل المفاتيح وكذلك سنفترض ان حساب دالة الهاش هو (O(1
قانون :
في جدول هاش مع سلسلة فيه التوزيع متساو لكل المفاتيح بحث فاشل يقوم ب-(O(1+a فعاليات (وقت الفعالية)
اثبات :
بما ان التوزيع متساو لكل المفاتيح الاحتمال بان مفتاح K يذهب لخلية معينة متساو لكل الخلايا (m خلايا) لذا الوقت المتوسط للبحث الفاشل عن k مساو تماما للوقت المتوسط لبحث أحد السلاسل والطول المتوقع لسلسلة كهذه هو مقدم الكثافة أو a اي ان وقت البحث المتوسط هو a ومع حساب دالة الهاش :
الوقت المتوقع هو : (O(1+a.
قانون :
في جدول هاش مع تشابك وفي الجدول التوزيع للمفاتيح متساو, بحث ناجح متوسط وقت البحث هو: (O(1+a.
ومن القانونين في الأعلى نستنتج ان كبر الجدول يجب أن يكون مشابها لعدد القيم المراد تخزينها اي بحالة وجود (O(n قيم عندها كبر الجدول هو (O(n وعندها تكون العلمليات كل واحد منها تنفذ ب-(O(1 وقت
==دوال هاش==
هنالك عدة حالات بناء على المعلومات التي لدينا عن التوزيع :
# إذا كان التوزيع معطى اي انه لكل مفتاح عندها:(h(k)=floor(km
في الحالات الأخرى وعند الافتراض ان المفاتيح ارقام طبيعية نستطيع استخدام الطرق التالية :
# * طريقة القسمة اي: h(k)=m mod k
# * طريقة الضرب اي: ((h(k)=(floor(m(1 kA mod عندما: A بين 0 و 1
{{شريط بوابات|معلوماتية|تعمية}}
 
{{تصنيف كومنز|Hash tables}}
 
[[تصنيف:خوارزميات بحث]]
[[تصنيف:علمبنى الحاسوبالبيانات]]