المساعد الشخصي الرقمي

مشاهدة النسخة كاملة : برنامج مفهرس المخطوطات


AHMED ADEL
Sep-16-2006, 04:19 PM
مفهرس المخطوطات
لتنزيل مفهرس المخطوطات: اضغط هنا (http://www.maknoon.com/maknoon_islamic_encyclopedia.php)

يقوم برنامج مفهرس المخطوطات بفهرسة كتب الـ PDF و الـ DjVu، وعلى ذلك يحتاج إلى مستعرض PDF المعروف Adobe Acrobat Reader وأيضا مستعرض DjVu المعروف بـ LizardTech DjVu Browser Plug-in 6.0.
بالإضافة إلى الفهرسة يمكِّن البرنامج المستخدم من البحث خلال الفهرسة وعرض الصفحة المحددة التي تتضمن نتيجة البحث بإحدى المستعرضات السابقة.
فكرة عمل فهرسة الكتب المصورة هي عمل ملف نصي (TXT) لكل كتاب يتضمن فواصل للصفحات، وعلى المستخدم إدخال ما يريد البحث عنه في كل صفحة سواء وضع الصفحة بكاملها أو مختصر عنها أو كلمات محورية للصفحة تستطيع من خلال البحث الوصول إلى الصفحة المطلوبة، ويمكن الاستفادة من الكتب النصية المنتشرة في الشبكة، كما يمكن استخراج النص مباشرة من ملف PDF أو DjVu باستخدام بعض الأدوات التي ستضاف للبرنامج في نسخه القادمة إن شاء الله تعالى إذا كان ملف الـ PDF أو الـ DjVu محول عن ملف نصي وليس عن صور.
مزية البرنامج هو محاولة الجمع بين الثقة في الكتب المصور عن أصولها وبين إمكانية البحث في هذه الكتب مع ترتيبها وتقسيمها. ويمكن الاستفادة من الكتب النصية المنتشرة في الشبكة، كما يمكن استخراج النص مباشرة من ملف PDF أو DjVu باستخدام بعض الأدوات (للغة الإنجليزية فقط) وأما اللغة العربية فستضاف للبرنامج في نسخه القادمة إن شاء الله تعالى إن توفرت الأدوات المناسبة. كذلك يتميز محول DjVu بإمكانية قراءة الصور كما يعمل OCR أما محول الـ PDF فيعمل على الملفات التي تم تحويلها عن ملف نصي وليس عن صور.
كيفية عمل نظام المفهرس

عند ابتداء البرنامج لأول مرة ستظهر لوحة الإعدادات، عليك عندها أن تضع مسار برنامج Adobe Acrobat Reader مثل [C:\Program Files\Adobe\Acrobat 7.0\Acrobat\Acrobat.exe] ليتعرف البرنامج على مستعرض ملفات PDF، وأما ملفات DjVu فلا حاجة لذلك.
http://www.maknoon.com/images/arabicIndexer1.png

البرنامج يأتي خاليا من أية تصانيف أو كتب أو فهارس، ولذلك عليك تحميل الكتب كما يلي:

اختر 'استيراد قوائم الكتب' من قائمة 'ملف'، ثم ستظهر لك لوحة لتعيين ملف تحديث قاعدة البيانات، عليك اختيار ملف بصيغة biuf (ستجد ملف تجريبي يشحن مع البرنامج).
ثم ستظهر لك لوحة لتعيين الموضع التي ستخزن فيه ملفات PDF's و DjVu المستوردة.
وبعد ذلك سيتم استيراد الكتب من ملف التحديث ووضعها في المكان الذي تم اختياره وسيتم إضافة ملفات الفهرسة في مجلد الفهارس indexingFiles، كما سيتم إضافة الكتب مقسمة إلى قاعدة البيانات لتظهر للمستخدم فيما بعد.
http://www.maknoon.com/images/arabicIndexer2.png

على المستخدم بعد ذلك فهرسة الكتب المدخلة دفعة واحدة بتحديد 'الأقسام' ثم الضغط على فهرسة http://www.maknoon.com/images/indexingButton.png من القوئم المتحركة أو لوحة التحكم أسفل لوحة الأقسام والكتب.
عند ذلك يمكن للمستخدم البحث في الكتب كم هو مبين.

<LI style="COLOR: #ff0000">خيارات البحث

يقوم محرك البحث بالبحث في جميع صفحات الكتب، وله العديد من المزايا منها:

استخدام '?': فمثلا البحث عن 'أ?ل' سينتج عنها البحث عن جميع الكلمات باستبدال ? بجميع الحروف مثل: أكل، أصل، أقل وهكذا، ويمكن استخدام الأداة أكثر من مرة وبشكل متتابع على أن لا يبتدأ بها كلمة البحث، أي أن الأداة تمثل حرف واحد غير مميز.
استخدام '*': لها نفس وظيفة الأداه السابقة إلا أنها تستخدم لأكثر من حرف واحد، ويمكن استخدام الأداتين معا مثل: 'م؟ر*' سينتج عنها البحث عن: ميراث، مبرأ، معرفة، معروفة وهكذا.
استخدام '-' أو '!': تستخدم لحصر النتائج فمثلا: 'ميراث - أسباب' سيتنج عنها جميع الصفحات التي تحتوي على كلمة 'ميراث' ولا تحتوي على كلمة 'أسباب'.
استخدام 'أو' و 'و' وهما معروفتان.

وهناك خيارات كثيرة هذه أهمها والبقية سيأتي شرحها مع النسخ القادمة إن شاء الله (مثل ( ) و " و + و أيضا ~ للغة الإنجليزية) كما أن البحث يتميز بسرعته الجيدة (وسنقوم بترجمة المصطلحات الإنجليزية إلى عربية إن شاء الله تعالى).
بالإضافة إلى ذلك سيتم تطوير محرك البحث لتمييز التشكيل وأهمية الصفحة (Ranking) كما في Google، كما سيتم تطوير معالج الكلمات العربية (Arabic Analyzer) تباعا في النسخ القادمة إن شاء الله تعالى.

<LI style="COLOR: #ff0000">أدوات المفهرس

<LI style="COLOR: #009900">الإضافة

يمكن للمستخدم أن يضيف كتابا مكون من مجلد واحد أو أكثر تحت قسم معين حسب تحديد المستخدم، فمثلا تحديد 'الأقسام' ثم الإضافة إليه سيمكن المستخدم من إضافة قسم مع كتاب واحد على الأقل، أما تحديد قسم معين فسيمكن المستخدم من إضافة كتاب فقط، وأما تحديد كتاب مكون من عدة أجزاء سيمكن المستخدم من إضافة جزء فقط وهكذا كما في المثال التالي:
http://www.maknoon.com/images/arabicIndexer3.png
http://www.maknoon.com/images/arabicIndexer4.png

حيث أن:

عنوان الكتاب: اسم للكتاب المكون من جزء واحد أو اسم جزء واحد من كتاب مكون من عدة أجزاء.
مجلد الكتاب: اسم الكتاب المكون من عدة أجزاء، عدم إدخال اسم لمجلد الكتاب يعني أن الكتاب مكون من جزء واحد، وعلى هذا فإن جميع عناوين أجزاء الكتاب الواحد لها نفس اسم 'مجلد الكتاب'.
هل الكتاب المصور: هذا الخيار سيكون نافعا عند استخدام أداه لاستخراج النصوص من الكتب المحولة من ملفات نصية مثل MS Word وغيرها وتحويلها إلى ملف للفهرسة مباشرة، وأما الكتب المصورة فلا مجال لذلك، وهذا الخيار في الوقت الحالي غير مطبق للغة العربية وسيطبق مع اللغة الإنجليزية في النسخة القادمة إن شاء الله.
موضع الكتاب: مسار الكتاب.

وبعد التنفيذ ستظهر للمستخدم رسالة مفادها أن على المستخدم فهرسة الكتب المضافة، وفي الوقت نفسه ستظهر ملفات الفهرسة فارغة ليقوم المستخدم بتحريرها، الملف سيتضمن فواصل مثل [&ouml;&ouml;&ouml;&ouml;&ouml;&ouml; 1 &ouml;&ouml;&ouml;&ouml;&ouml;&ouml;] ليدل على الصفحة الأولى وعلى المستخدم أن يضع ما يشاء فوق هذا السطر ليكون محتوى الصفحة الأولى الذي سيدخل في عملية البحث.

<LI style="COLOR: #009900">التصدير

يمكن البرنامج المستخدم من تصدير ما يريده من الأقسام أو الكتب أو من الأثنين معا وكل ما عليه فعله هو تحديد ما يريد تصديره في لوحة الأقسام والكتب ثم الضغط على تصدير http://www.maknoon.com/images/exportButton.png من القوائم المتحركة أو لوحة التحكم أسفل لوحة الأقسام والكتب.
وهناك عدة خيارات للتصدير في قائمة 'إعدادات'، وهي إمكانية اختيار الملفات التي سترفق مع ملف التصدير بصيغة biuf من ملفات الفهرسة وكتب الـ PDF أو الـ DjVu.


كما أن هناك خصائص أخرى مثل التحرير والحذف والفهرسة والبحث في عناوين الكتب وغير ذلك من الخصائص سيأتي شرحها تباعا إن شاء الله تعالى.

<LI style="COLOR: #ff0000">سجل التحديثات

<LI style="COLOR: #800000">من النسخة 1.0 إلى 1.1

ترجمة بعض الكلمات التي تستخدم في البحث مثل AND و OR إلى العربية.
تعديل في محرك البحث حتى يتمكن من البحث في جميع الصفحات بعد أن كان محددا بـأول 100 صفحة من كل كتاب.
إضافة خاصية استخراج النص تلقائيا من كتب الـ PDF الغير مصورة للغة الإنجليزية فقط وكذلك كتب الـ DjVu للغة الإنجليزية (ويتميز بإمكانية قراءة الصور مثل OCR ولكن ليس على درجة عالية من الدقة).وأخيرا نرجوا من الأخوة المساهمة في فهرسة الكتب وتقسيمها، وقد جاء البرنامج بعد رؤية الجهود المباركة لتصوير الكتب العلمية بأفضل التحقيقات وخاصة من روَّاد ملتقى أهل الحديث
ولا تنسونا من صالح الدعاء
http://www.maknoon.com/arabicIndexer.php

هدى العراقية
Sep-16-2006, 09:07 PM
السلام عليكم ورحمة الله وبركاته

جهود مميزة ورائعة اخي الكريم احمد عادل شكرا لك على هذا الطرح وهذا الشرح الوافي
جزاك الله خير جزاء ونحن نتظر منك الجديد والمفيد


تقبل فائق احترامي وتقديري