فضاء قيمي المكتبات المدرسية

فضاء قيمي المكتبات المدرسية

إقليم بنسليمان بجهة الشاوية ورديغة
 
الرئيسيةالرئيسية  البوابةالبوابة  اليوميةاليومية  مكتبة الصورمكتبة الصور  س .و .جس .و .ج  بحـثبحـث  الأعضاءالأعضاء  المجموعاتالمجموعات  التسجيلالتسجيل  دخولدخول    

شاطر | 
 

 تعريف التكشيف ونظمه: فهد الكردي

استعرض الموضوع السابق استعرض الموضوع التالي اذهب الى الأسفل 
كاتب الموضوعرسالة
Admin
Admin


ذكر عدد المساهمات : 65
تاريخ التسجيل : 08/11/2009

مُساهمةموضوع: تعريف التكشيف ونظمه: فهد الكردي   الأربعاء نوفمبر 18, 2009 9:28 am

تعريف التكشيف Indexing

تعد كلمة تكشيف من الكلمات الحديثة الاستعمال في اللغة العربية، وهي مشتقة من الفعل الثلاثي كشف، وكشف الشيء تعني أظهره ورفع عنه ما يواريه أو يغطيه.

أما في علوم المكتبات فيقصد به أحد أشكال التحليل الموضوعي للوثائق.

التكشيف عبارة عن عملية خلق المداخل في كشاف أو إعداد المداخل التي تقود للوصول إلى المعلومات في مصادرها.

كما يقصد به إعداد الكشافات أو إعداد مداخل الكشافات التي تؤدي للوصول إلى المعلومات في مصادرها وتتضمن هذه العملية بإيجاز فحص الوثيقة وتحليل المحتوى وفقاً لمعايير محددة، وتحديد مؤشرات المحتوى، وإضافة مؤشرات المكان، وتجميع المداخل النتاجة في كل متماسك.

بذلك فإن التكشيف يجمع بين خصائص كل من العمل والفن.

ويقصد به أيضاً انتقاء مجموعة من الكلمات المفتاحية الدالة تسمى الواصفات مأخوذة من اللغة الطبيعية للوثيقة .


نظام التكشيف Indexing System:

وهو عبارة عن مجموعة من الإجراءات تنظم محتويات تسجيلات المعرفة لأغراض استرجاعها عند الحاجة.


نظم التكشيف :-

نظم التكشيف التقليدية:-
تقوم هذا النظم بترتيب الموضوعات نسقياً ويمكن أن يكون هجائياً أو رقمياً وهجائياً Alpha –numerical كما يمكن أن يكون مصنفاً وفقاً لنظام تصنيف معين.


التكشيف الرقمي :-

تسجل الموضوعات التي تستخدم مداخل بحيث تكون في تسلسل منطقي إلى حد ما يوضح العلاقات الهرمية، ثم ترقم المداخل حسب ورودها في القائمة ويكون هذا العمل سهلاً وبسيطاً إذا كانت الموضوعات قليلة ولكنها ذات تغطية

عريضة مع مراعاة إمكان الإضافة أي إضافة مصطلحات جديدة.

وهذا النظام يحلل الوثيقة عند ورودها، ويحدد الرقم المناسب لمحتوياتها، وترتب في مكانها بالنسبة للمواد المرقمة بحيث يمكن الرجوع إليها مباشرة، وقد تحتاج إلى إعداد كشاف هجائي لقائمة الموضوعات وفي حالة الوثائق المركبة يفضٌل إعداد كشاف بطاقي يشتمل على عدة بطاقات لكل وثيقة مفردة، ويسجل على كل بطاقة مفردة أحد الموضوعات التي تعالجها، واشتمال الكشاف على بعض الإحالات .


التكشيف الهجائي :-

يتم الاعتماد في هذا النظام على قائمة لرؤوس الموضوعات وذلك للتحقق من كل وثيقة على حدة، وهذه الرؤوس تأخذ من قائمة رؤوس موضوعات مرجعية جيدة، كما تستخدم الإحالات للإشارة إلى جوانب الموضوع الممكنة، ومن المآخذ على هذا النظام أنها تفصل المواد المتصلة بعضها عن بعض، وذلكتبعاً لمكانها في الترتيب الهجائي .


التكشيف الهجائي الرقمي :-

وهو عبارة عن مزج حروف الهجاء والأرقام في التكشيف ويتم تسجيل الموضوعات العريضة في ترتيب هجائي ثم ترقم تفريعاتها، وترتب الوثائق وفقاً لرقم الموضوع الذي تعالجه .


التكشيف المصنف :-

أصبح هذا النظام يعرف في عالم التكشيف بتكشيف الدوريات ، ويقصد به أن تأخذ المداخل أرقام خطة التصنيف المستخدمة ثم ترتب هذه المداخل حسب الأرقام ومن مميزاته جمع كل ما يتعلق بالموضوع في مكان واحد.

ومن عيوبه أن على المستفيد معرفة نظام التصنيف المتبع ، أو الرجوع إلى الكشاف الموضوعي الهجائي الذي يرشد إلى رقم التصنيف.


التكشيف الآلي :-

يمكن القول إن هناك أسلوبين لممارسة التكشيف بوجه عام وهما تكشيف الكلمات Word Indxing أو التكشيف الاشتقاقي Derivative Indexing

أو التكشيف بالاقتطاف Extraction Indexing من ناحية. وتكشيف المفاهيم Concept Indexing أو التكشيف بالتعيين Assignment Indexing من ناحية أخرى ففي اقتطاف أو اشتقاق المداخل الكشفية من عناصر النص الذي يتم تكشيفه كما يجري في كشافات النصوص Concordances وكشاف الكلمات المفتاحية في السياق (K W I C ) Key Word In Context يعتمد الأول على النصوص الكاملة ، ويعتمد الثاني على عناوين الوثائق، أما في الأسلوب الثاني فتكشف المفاهيم، حيث يتم تعيين مجموعة من المصطلحات الكشفية المستقاة من إحدى لغات التكشيف بغض النظر عن أن المصطلحات وردت في النص أم لا .

ويقوم نظام الحاسوب في التكشيف الآلي باقتطاف بعض الكلمات أو الجمل الواردة في النص وذلك للدلالة على محتوى النص كله.

وإذا ما توافر النص في شكل قابل للتداول بواسطة الحاسوب فإنه يمكن برمجة الحاسوب ليطبق أسلوب التكشيف بالاقتطاف بناء على تكرار تردد الكلمات أو العبارات وموقع الكلمات أو العبارات في النص.


التكشيف الآلي بناءً على تكرار تردد المصطلحات:-

إن معظم جهود التكشيف الآلي تتفق على أن مدى تكرار تردد الكلمات في نصوص اللغة الطبيعية دلالة على أهمية هذه الكلمات لأغراض التعبير عن المضمون .

وعندما يكون النص في شكل قابل للتداول بواسطة الحاسوب يستخدم عدد من البرامج البسيطة التي تقوم بمقارنة النص بقائمة استبعاد Stop List تشتمل على الكلمات النحوية أو الوظيفية لاستبعاد الكلمات التي لا تحمل دلالة موضوعية ومن ثم إحصاء عدد مرات تردد الكلمات التي لها دلالة موضوعية وترتب تنازلياً وفقاً لعدد مرات ترددها في النص، وتعد الكلمات التي ترد على القمة هي الكلمات التي اختيرت لتكون مصطلحات كشفية للوثيقة، ويمكن تحديد عدد المصطلحات الكشفية لكل وثيقة بناء على معايير محتملة، كتحديد عدد يتناسب وطول النص، أو الاكتفاء بالكلمات التي يزيد عدد مرات تكرارها عن حد معين، وكذلك يمكن إحصاء تكرار العبارات، حيث يمكن تكشيف الوثائق بالجمع بين الكلمات والعبارات.

وهناك مشاكل تنجم عن تعدد الأشكال النحوية للكلمات، وللتغلب عليها يمكن الاعتماد على برامج تتعامل مع جذور الكلمات، أي تجريد الكلمات من الصدور حيث يمكن استبعاد كواسع معينة من الكلمات مثال ذلك استبعاد ing ، ed، ...وغيرها.

أما في اللغة العربية فإن نظم التحليل الصرفي أو التجريد ما تزال في مراحلها المبكرة، وقد لاقت مؤيدين ومعارضين في إدخال الحركات في معالجة الكلمات العربية وانعكس هذا الانقسام إلى تطوير خوارزميات التحليل الصرفي في اللغة العربية، وليس التكشيف.

وقد كان استرجاع المعلومات سبباً من أسباب تطوير هذه الخوارزميات ولكنه كان الهدف الأساسي لتطوير أساليب العربية.

وأجريت بعض التجارب في هذا السياق تهدف إلى دراسة التكشيف واسترجاع البيانات الو رقية العربية وخلصت هذه الدراسة إلى النتائج الآتية :-

أن استعمال جذور الكلمات وجذوع الكلمات مصطلحاتِ كشفيةً يسفر عن نتائج أفضل.

ومن عيوب الاعتماد على تكرار الكلمات، أن الكلمات التي تتكرر كثيراً في وثيقة ما، لا تكون بالمصطلح المميز الذي يعبر عن الوثيقة، ويمكن لهذا المصطلح أن يتكرر كثيراً في مرصد بيانات ككل وليس في وثيقة بعينها.

التكرار النسبي للمصطلحات :-

في التكرار النسبي ليس من الضروري حساب تكرار ورود الكلمة في مرصد بيانات النصوص كاملة، وإنما حسب تكرار ورود الكلمة فقط في الملف المقلوب أو الملف المصنف Inverted File المستخدم في البحث في النصوص، أي عدد مرات ورود الكلمة بالنسبة لعدد مرات ورود جميع الكلمات في الملف، وهذا هو المقصود بالتكرار النسبي، أي أن الكلمات أو العبارات تختار عندما ترد مكررة في وثيقة ما على نحو أكثر كثافة من تكرار ورودها في مرصد البيانات ككل.

ويتطلب هذا إحصاء تكرار ورود كل كلمة في مرصد البيانات ومقارنة هذا التكرار في وثيقة بعينها .

التكشيف الآلي بالتعيين:-

التكشيف بواسطة التعيين عبارة عن إعداد مجموعة من السمات Profile لكل مصطلح يمكن تعيينه، وتتكون من الكلمات أو العبارات التي تتكرر في الوثائق التي يمكن للمكشف البشري أن يعٌين لها المصطلح، فإذا كان لكل مصطلح في لغة التكشيف المقٌيدة سمات ترتبط بالمصطلح، فإنه يمكن استخدام برامج الحاسوب لمضاهاة العبارات المهمة الواردة في الوثيقة، وتعيين مصطلح الوثيقة إذا كانت سمات الوثيقة تضاهي سمات المصطلح على نحو يزيد عن حد معين .

التكشيف بمساعدة الحاسوب :-

والمقصود منه الاستعانة بالحاسوب في عملية التكشيف والفرق بين التكشيف الآلي والتكشيف بمساعدة الحاسوب فرق في الدرجة وليس في النوع فيساعدالحاسوب في تحليل النصوص للخروج بقائمة بالمصطلحات الكشفية المختارة من إحدى اللغات المقيدة ويتم ذلك بتطبيق بعض القواعد .

أما المساعدة الثانية التي يقوم بها الحاسوب فإنها تحليل عمل المكشف، حيث يمكن اقتراح مصطلحات كشفية إضافية أو بيان أخطاء التكشيف أو أخطاء الترجمة من اللغة الطبيعية إلى اللغة المقيدة، ويطبق هذا على ناتج التكشيف وليس على النص الذي يتم تكشيفه .

وقد تطورت العديد من النظم التي تهدف إلى تسخير الحاسوب في مساعدةالمكشفين، ومن أبرز هذه النظم نظام "نفيس" وهو نظام تكشيف العبارات المجمعة ثم طور هذا النظام من قبل تيموثي كرافن Timothy C. Craven بمعهد المكتبات والمعلومات في جامعة وسترن أونتاريو، حيث أصبح يتعامل هذا النظام مع العناوين لإعداد كشاف التباديل Permuted وهو يختلف عن كشاف الكلمات المفتاحية في السياق حيث يتعامل الأخير مع الكلمات لا العبارات، كما يمكن الاعتماد على هذا النظام في عملية الإحالات.

وقامت جسيكا ملستيد بدراسة لأساليب الاعتماد على الحاسوب بصفة عاملا مساعدا في التكشيف في سياق مراجعة النتاج الفكري في مجال التحليل الموضوعي في مراصد البيانات الورقية، حيث تم تطوير نظام في مؤسسة معلومات علوم الأحياء BIOSIS ففي هذا النظام تم مضاهاة الكلمات التي ترد في عناوين مقالات الدوريات وذلك مقابل معجم دلالي Semantic Vocabulary يشتمل على حوالي (15000) مصطلح في علوم الأحياء وترتبط المصطلحات بمعجم يشتمل على (600) رأس موضوع وتتم المضاهاة ويحدد الحاسوب المداخل الموضوعية لتكشيف المقالات .

وقد أشار لانكستر Lancaster إلى مجموعة من الأخطاء الرئيسة التي يمكن أن تحدث في أي نظام تكشيف منها :-

1- خطأ في التحليل الموضوعي حيث لا يوفق المكشف في فهم الموضوع فيفسره بطريقة مخالفة.

2- خطأ الترجمة أي رغم إدراك المكشف لمحتوى الوثيقة جيداً، إلا أنه لا يوفق في اختيار المصطلحات التي تعبر عن المعاني الصحيحة.

3- خطأ في استبعاد بعض المفاهيم المهمة خلال عملية التحليل الموضوعي.

4- ضعف خصوصية المصطلحات. فالمكشٌف يدرك المفاهيم ومستوى الخصوصية المطلوبة، لكنه مضطر لتكشيفها بمصطلحات عامة لعدم توفر المصطلحات المخصصة في لغة التكشيف المتاحة.

5- ضعف خصوصية التكشيف. فالمكشف يستخدم مصطلحات عامة وبعيدة العلاقة عن المفهوم المخصص في الوثيقة، رغم أن لغة التكشيف تتضمن مصطلحات أكثر خصوصية.


http://maktabat-sy.net/vb/showthread.php?t=304
الرجوع الى أعلى الصفحة اذهب الى الأسفل
معاينة صفحة البيانات الشخصي للعضو http://bibliosco.forumactif.org
 
تعريف التكشيف ونظمه: فهد الكردي
استعرض الموضوع السابق استعرض الموضوع التالي الرجوع الى أعلى الصفحة 
صفحة 1 من اصل 1

صلاحيات هذا المنتدى:لاتستطيع الرد على المواضيع في هذا المنتدى
فضاء قيمي المكتبات المدرسية :: الفضاء العام :: فضاء التكشيف-
انتقل الى: