منتديات اليسير للمكتبات وتقنية المعلومات » منتديات اليسير العامة » منتدى تقنية المعلومات » لماذا المرور من MARC إلى XML

منتدى تقنية المعلومات هذا المنتدى مخصص للموضوعات الخاصة بتقنية المعلومات التي تتعلق بالمكتبات ومراكز مصادر المعلومات ومراكز مصادر التعلم.

إضافة رد
قديم Apr-04-2003, 09:34 PM   المشاركة1
المعلومات

حسن علية
مكتبي فعّال

حسن علية غير متواجد حالياً
البيانات
 
العضوية: 377
تاريخ التسجيل: Aug 2002
الدولة: السعـوديّة
المشاركات: 111
بمعدل : 0.01 يومياً


افتراضي لماذا المرور من MARC إلى XML

رواد منتدى اليسير الأحباء
السلام عليكم ورحمة الله
وبعد :
لقد كانت المكتبات دوما من أهم المستخدمين للتطورات التكنولوجية المستخدمة في مجال المعلومات ( تخزين , تبادل و هيكلة ) و ذلك بهدف المحافظة على دورها الأساسي و هو نشر المعرفة و تقريب المعلومة من القارئ وكما يعلم الجميع فإن أهم تطور شهدناه في المدة الأخيرة هو ظهور الإنترنت و ما رافقها من إنفجار هائل لكمية المعلومات المتاحة للمستعمل ومما إنجر عنه من مشاكل البحث على المعلومات في هذه الشبكة و قد تناول الأخ الفاضل عبد العزيز الخبتي مشكورا في مداخلات سابقة أحد أسباب هذه المشكلة و هو إعداد إستراتجية البحث ولكن جانب كبيرمن مشكل البحث على الإنترنت يعزوه المختصين إلى لغة البرمجة المستعملة HTML و قصورها على الهيكلة المنطقية للوثائق فهذه اللغة تمكننا من نشر الوثائق ولاتمكننا من خيارات واسعة للبحث داخل الوثائق( و إذا يرغب أحد الزملاء في التعمق في هذه النقطة فهذا موضوع جيد) لذا انطلقت العديد من الأبحاث و التي توجت بعديد النائج مثل DHTML و METADATA و لعل أهم نتيجة هي إصدار XML و هو اللغة المرشحة لخلافة HTML على الواب و هذه اللغة ورثة سهولة استعمال HTML و قوة الهيكلة من SGML و بسرعة طرح السؤال داخل عالم المكتبات لماذا لايتم استبدال MARC ب XML
و سوف نستعرض فيما يلي بعض نقاط القوة لل XML مقارنة بال MARC : - XML
يمكننا من إيجاد الحقول التي نحتاجها بدون التقيد بعدد معين بينما كما تعلمون فإن عدد الحقول محدد ب 999 حقل بالنسبة لل MARC - XML
يمكننا مباشرة من وضع التسجيلات الببليوغرافية على الواب بينما MARC يحتاج لبرمجيات وسيطة
ملائمة XML للوثائق المتعددة الوسائط مما يمكن من إحداث قواعد بيانات ذات محتوى أكثر ثراء

ولكن السؤال المقابل هو هل نحن محتاجين لكل هذه الإمكانيات داخل المكتبات و هل إستعملنا كل حقول المارك حتى نفكر في الزيادة ؟
وفي الأخير أود أن أحيي أخي عبد الله الشهري و أتمنى أن تصل مشاركاتي إلى المستوى الذي ذكر
و لكم مني أجمل التحيات
حسن علية
----------------------
مثل كلمة طيبة كشجرة طيبة أصلها ثابت و فرعها في السماء













التعديل الأخير تم بواسطة وصال المجد ; Apr-15-2008 الساعة 06:05 PM
  رد مع اقتباس
قديم Apr-06-2003, 01:59 AM   المشاركة2
المعلومات

أبـوفـيـصـل
إدارة المنتدى

أبـوفـيـصـل غير متواجد حالياً
البيانات
 
العضوية: 391
تاريخ التسجيل: Aug 2002
الدولة: السعـوديّة
المشاركات: 2,363
بمعدل : 0.30 يومياً


افتراضي

ما هو XML؟
XML اختصار لمصطلح Extensible Markup Language وهي شكل مبسط من لغة SGML (Standard Generalized Markup Language) تستخدم XML في المقام الأول في تعريف البيانات في المستندات، وهي على العكس من لغة HTML لا تعتمد على مجموعة ثابتة من الرموز. وتتميز XML بأنها تسمح لك بنسج نظام مختلف من الرموز للتعامل مع المجالات العلمية الأكثر تخصصاً في الوقت الذي تتفق هذه النظم مع القواعد العامة للغة XML، مثل لغة MathML (الخاصة بالتعرف على المصطلحات الرياضية المتخصصة).
وتنقسم المستندات المكتوبة بـXML إلى نوعين إما well formed أو valid.
كل ما تحتاج معرفته هو أن النوع الأول من المستندات (well formed) هو أبسط شكل من الممكن الحصول عليه، أما النوع الثاني (valid) فيعتمد على نظام Data Type Definition. وهو شكل أكثر تعقيداً يمنحك المزيد من التحكم في مستنداتك وذلك لأنه يوفر نظام قياسي لكي تسير عليه مستنداتك.
وهذا موقع على الشبكة يتحدث عن هذه اللغة:http://www.linuxfocus.org/Arabic/May...ticle242.shtml













التعديل الأخير تم بواسطة وصال المجد ; Apr-15-2008 الساعة 06:07 PM
  رد مع اقتباس
قديم Apr-08-2003, 09:10 PM   المشاركة3
المعلومات

حسن علية
مكتبي فعّال

حسن علية غير متواجد حالياً
البيانات
 
العضوية: 377
تاريخ التسجيل: Aug 2002
الدولة: السعـوديّة
المشاركات: 111
بمعدل : 0.01 يومياً


افتراضي

السلام عليكم و رحمة الله
أشكر الأخ أبو فيصل على الإيضاحات النظرية التي أوردها فيما يخص XML وفي مايلي سوف أقدم واصفة ببليوغرافية حسب التقنين الدولي UNIMARC وتجدون على شكل ملف مرفق محاولة إستغلالها بإستعمال XMLوهذا نص الواصفة :00513nam 2200193 450 01000130000010000410001310100080005410200080006220 00057000702100032001272150024001592250016001836100 01700199700001800216702001700234801002600251915001 100277930003100288- $a97625687- $a20011225d1960 K y0arby50 fa- $aara- $asyr-1 $aالأساسي في علم الأنسجة$eالأنسجة الضامة$fمنير المعتضد- $aدمشق$cدار المعتز لنشر$d1960- $a120 ص.$cمصور$d24 س.-1 $aعلوم الحياة- $aالأنسجة, علم- 1$aالمعتضد$bمنير- 1$aالمحتسب$bعلي- 1$aTunisie$bBIRUNI$c2001- 1$a457821- $a14587ع8$bكلية الآداب منوبة-%أنظروا الرابط التالي :تحميل الملف : CCK120030408140103.doc وحجمه / 502784 بايت تمت العملية في : 4/8/2003 2:01:03 PM
أخوكم حسن علية













التعديل الأخير تم بواسطة وصال المجد ; Apr-15-2008 الساعة 06:08 PM
  رد مع اقتباس
قديم Feb-27-2004, 08:46 PM   المشاركة4
المعلومات

حسن علية
مكتبي فعّال

حسن علية غير متواجد حالياً
البيانات
 
العضوية: 377
تاريخ التسجيل: Aug 2002
الدولة: السعـوديّة
المشاركات: 111
بمعدل : 0.01 يومياً


افتراضي XML لغة المستقبل للبيئة الرقمية لماذا ؟

رواد اليسير الأحباء
السلام عليكم ورحمة الله
هذا مقال مفصل حول لغة التأشير XML الذي أرجو أن يكون مفيدا للجميع لقد حاولت أن أرفق نسخة كملف مرفق لكن تعذر ذلك لذا فأرجوا المعذرة إذا إختفت بعض الأشكال التوضيحية
أتمنى لكم قرائة ممتعة XML لغة المستقبل للبيئة الرقمية لماذا ؟
التخطيط :
1 المقدمة
2اللغة المؤشرة للنص الفائق
HTML 2.1 لمحة تاريخية و التعريف
2.2 تركيبة وثيقة
HTML 2.3 نقاط قوة
HTML 2.4 نقاط ضعف
HTML 2.5 الخلاصة
3 اللغة المقننة لتأشير المعمم
SGML 3.1 لمحة تاريخية
3.2 الهدف
3.3 وثيقة SGML3.4 مثال تطبيقي
3.5 الخلاصة
4 اللغة التأشير الموسعة
XML4.1 لمحة تاريخية والتعريف
4.2 الأهداف
4.3 الفــــروق بين XML وSGML
4.4 أمثلــــــة
4.5 XML تنوع ا لروابط التشعبية
4.6 مفهوم المصدر العالمي للأسماء
Universal Ressource Name ) 4.7 برامج معلوماتية تخص XML 5
تجـــارب و تطبيقـــــات XML
6 الخلاصة
7 المصادر 1

المــــــقـــــدمــــــــــة :
إن إنتقال الإنتاج الفكري البشري من الوعاء الورقي إلي الوعاء الرقمي أتاح العديد من الإمكانيات في مجال التعامل مع الوثائق التي لم تكن متاحة في السابق وخاصة ظهور مفهوم النص الفائق الذي أحدث تغيرا جذريا في تصورنا لمعنى الوثيقة التي بقية لمدة طويلة لا تعدو أن تكون سوى صفحات متتالية مكتوبة من طرف شخص أو مجموعة أشخاص أو هيئة و لا يمكن الإطلاع عليها إلا بطريقة خطية أي بمعنى الإطلاع مثلا على الصفحة 1 , 2, 3, .... وهو أسلوب متوافق جدا مع تقنية الطباعة على الورق بينما ما يتوفر داخل البيئة الرقمية من خلال النص الفائق يإستعمال الروابط التشعبية يتجاوز كثيرا ما كان معروفا لدينا فالقارئ الآن لديه حرية الإطلاع على الوثيقة بالطريقة التي تتلائم مع حاجته الحقيقية للمعلومات من خلال إبحاره مستعملا الروابط المختارة وبهذا فكل قارئ يصوغ وثيقة تتوافق مع حاجته وليس كما يريد الكاتب وبتوازي مع كل هذا الثراء فإن تركيبة البيئة الرقمية إزدادت تعقيدا وهشاشة فكما كان ظهور الإنترنت للعموم سريعا فقد كان ظهور الواب ولغة برمجتهHTML مفاجئا وكاسحا وسارع كل مستعملي الشبكة وصانعي البرمجيات لاحتضان هذه اللغة التي لا تعدو أن تكون في أساسها سوى حل فردي لمشكلة تبادل الوثائق بمعزل على أجهزة الحواسيب و الأنظمة المشغلة لها فهي ليست إلا إمكانية من بين عدد غير منتهي من الإمكانيات التي يتيحها SGML وكما كانت سرعة الإنتشار فقد كانت سرعة ظهور المشاكل ومحدودية إمكانيات هذه اللغة مما إستوجب مراجعة لغة النشر على الواب .و إننا من خلال هذا المقال سوف نحاول أن نقدم بسطة على اللغات التوصيفية أو لغات التأشير إنطلاقا من HTML ورجوعا إلى الأصل SGML و تقديم الحل المقترح و هو XML .2 اللغة المؤشرة للنص الفائق.

HTML 2.1 لمحة تاريخية و التعريف
لقد كان ظهور HTML نتيجة لأبحاث Tim Berners-Lee سنة 1989 و قد شهد العديد من التحديثات ففي سنة 1994 تم إصدار HTML-2 والذي يحتوي على 37 معلم و في سنة 1996 تم إصدار HTML-3 وفي سنة 1998 تم إصدار HTML-4.
إن HTML هي لغة مهيكلة لتوصيف البيانات فهي تمكننا من توصيف مختلف أجزاء الوثيقة على شكل نص بحت وهي لا تهتم بالشكل النهائي للوثيقة و لا بطريقة الطباعة و تكل ذلك للمبحر فشكل نفس الوثيقة قد يختلف من مبحر إلى آخر. 2.2 تركيبة وثيقة HTML : تتكون وثيقة HTML من جزئين وهي محدة بالمعلمين <HTML > < /HTML> :أ - الرأس ( head) و هو محدد بالمعلمين التاليين < head ></head > و يحتوي هذا الجزء على المعطيات العامة التي تخص الوثيقة(METADATA ) مثل تاريخ الإنشاء, المؤلف و الكلمات المفتاحية وهو ما نستطيع مقارنته بالتسجيلة الببليوغرافية و نجد العديد من البرامج المعلوماتية التي تمكن المرور من MEDATA إلى MARC.ب- الجسم ( BODY) وهو محدد بالمعلمين < BODY> </BODY> و يحتوي على نص المؤلف ويتكون من فقرات و عناوين محددة بمعالم و روابط بإتجاه مواقع أخرى 2.3 مثال لوثيقة HTML :<HTML><HEAD><TITLE>المحاولة الأولى </TITLE> <AUTHOR>حسن علية </AUTHOR> </HEAD><BODY><UL ><H1 >المنظمة العربية لتربية و الثقافة و العلوم </H1 ><H2 >النشأة </H2 >

لقد تم إنشاء المنظمة ................................ </P >..</UL ></BODY> </HTML> 2.3 نقاط قوة HTML :HTML - هو اللغة المعتمدة في الواب HTML - يمكن من إنشاء النصوص الفائقة من خلال الروابط التشعبية -تنوع وكثرة الأدوات التي تمكن من إنشاء و ثائق HTML حتى أصبح من لا يعرف أي معطى عن هذه اللغة -بإمكانه أن ينشأ وثائق HTML عن طريق إحدى برامج تحرير النصوص مثل word-office -إن الأوسام المستعملة داخل هذه اللغة محددة مسبقا مما يجعلها لغة سهلة الإستعمال وهذا أحد أسباب شيوع إستخدامها.2.4 نقاط ضعف HTML : إن توصيف الوثيقة بإستعمال HTML يمكن من هيكلة سيئة للوثيقة بحيث تختلط البنية المنطقية مع البنية الشكلية للوثيقة فمثلا فالواسم
يعني الرجوع إلى السطر وهذا يدخل في إعداد شكل النص. أما الواسم <title > < /title > يعني أن النص الموجود بين الواسمين هو عنوان وهي وحدة منطقية. إن الأوسمة لا تحتوي على أي معطى بالنسبة لمحتوى وثيقة معينة فنفس الأوسام تستعمل لكل أصناف الوثائق مما يجعل مستحيلا إستعمالها أثناء عملية البحث و محاولة لإثراء المعطيات حول محتوى وثائق HTML . تمت إضافة ما يعرف ب المعالم (META DATA ) أثناء مؤتمر DUBLING CORE لسنة 1998 - غياب مفهوم الوثيقة الجزئية ( sub-document) وهذا معطى مهما جدا خاصة بالنسبة للباحث الذي يعلم ما يريد وليس لديه و قت للإطلاع على كامل الوثيقة فنأخذ على سبيل المثال طبيب يريد التأكد من أعراض مرض ما لإتمام عملية تشخيص وهو ليس بحاجة لطريقة العلاج فالآن لا يمكننا أن نوفي بحاجة هذا المستفيد فكل ما يمكن أن نقدمه له هو وثيقة تحتوي على هذه المعلومة و قد يجد حاجته في الصفحة العاشرة وهذا لانتفاء مفهوم الوثيقة الجزئية .- غياب التنوع بالنسبة للروابط التشعبية المستعملة فالنوع الوحيد الممكن هو الرابط الثابت أحادي الطرفين الذي يربط وثيقتين في إتجاه واحد مما إنجر عنه سرعة نهاية صلوحية هذه الروابط نظرا للتغيير المستمر لعناوين المواقع على الواب.2.5 الخلاصة :إذا فنظرا لكل هذه النقائص فقد أحدثت مؤسسة w3c لجنة عمل أثمرت أعمالها إصدار XML و المنادات ببمواصلة العمل لجعله لغة بديلة على الواب. فما هي العلاقة بين HTML و XML ؟ إن هاتين اللغتين تنحدران من لغة أم واحدة و هي اللغة المقننة لتأشير (التوسيم) المعمم SGML (Standard Generalized Marcup language)فما هي هذه اللغة ولماذا لم تستعمل مباشرة بل استعملت لغات منحدرة منها ؟3 اللغة المقننة لتأشـــــير المعمـــــم SGML (Standard Generalized Marcup language)3.1 لمحة تاريخية لقد كان ظهور SGML سنة 1986 حيث تتوجت أعمال العديد من فرق البحث في موضوع لغة تأشير عالمية بإصدار SGML من طرف المنظمة الدولية للتقنين ISO (Inernational Standersation Organisation ) تحت عدد 8879 3.2 الهدف صياغة أنموذج بنية منطقية لتوصيف المعلومات توصيف المعلومات حسب هذا الأنموذجضمان إسمرارية صلوحية إستعمال المعلومات ضمان إستقلالية المعلومات عن الحواسيب و البرمجيات المستعملة 3.3 وثيقة SGML إن ما يسمى بوثيقة SGML هو البرنامج SGML لوثيقة ما و التي يمكن أن نقدمها بطريقة مجردة كما يلي :<!SGML>النص و الأوسام (المعالم)</SGML>وهي تتكون من ثلات أجزاء :3.3.1 التعريفات : وهي تتضمن تعريف ما يلي - شفرة المحارف المستعملة ( ASCI ,UNICODE, ….) - أبجدية اللغة و التي من خلالها نحدد بطريقة مجردة القواعد SGML مثلا في هذا المستوى يمكننا أن نحدد مغلقات و مفتحات الأوسام فمثلا تعودنا أن نرى الوسم ما بين العلامتين <> لكننا نستطيع أن نختار أي علامتين أخريين مثل {} ونفس الأمر بالنسبة لعلامة غلق الوسم المعروفة ب / و التي يمكن إستبدالها مثلا ب * و بذلك تصبح الأوسمة بهذا الشكل {title}…{*title} بدلا من <title> ... </title> بل يمكننا من خلال SGML أن نعرف أوسمة باللغة العربية مثل >عنوان< > , مقدمة < و لكنني لم أقف على أي تجربة عربية في هذا الإتجاه 3.3.2 الأنـــــمـــــوذج: إننا من خلال الأنموذج نقوم بتحديد البنية المنطقية لوثيقة ما و هو يكون قارا بالنسبة لصنف محدد من الوثائق فيمكن مثلا أن ننشأ أنموذجا خاصا بالرسائل نطبقه كلما أردنا أن نكتب رسالة و يمكن حفظه خارج وثيقة SGML وهو يتكون من: 3.3.2.1 إتفاقيات الكتابة : الروابط و مرتبة , و غير مرتبة &أو ׀مؤشرات الإستعمال :مرة واحدة أو أكثر +لا مرة أو مرة واحدة ?لا مرة , مرة واحدة أو العديد من المرات *{...} يرمز إلى مجموعة من الرموز 3.3.2,2 تعريف نوع الوثيقة DTD Document Type Definition : إن DTD هو عبارة عن مجموعة من القواعد و التعاريف التي تمكننا من توصيف صنف معين من الوثائق و يكون بهذا الشكل : < !DOCTYPE , عنوان dtd , مؤشر خارجي ؟, { ] , { تحديد المجموعات الضمنية }+, [ }؟ ,> تحديد المجموعات الضمنية يحتوي على : تحديد العناصر أو تحديد الخاصيات أو تحديد الوحدات مثال رقم 1 : < !DOCTYPE رسالة ] { توصيف مكونات الرسالة } [ >مثال رقم 2 : إستعمال dtd خارجي : < !DOCTYPE , رسالة SYSTEM رسالة. Dtd > 3.3.2.2.1 عــــــنـــــصــــر SGML: يتم الإعلان عن عنصر SGML داخل الأنموذج حسب الصيغة التالية : < ELEMENT ! , إسم العنصر , التصغيرات , نوعية المحتوى> تحليل مكونات العنصر : أ ) إسم العنصر وهو يمكن أن يكون : إسما أو إسما مركبا أو عددا أو عددا مركبا و حسب النشرة الأولى لSGML فيجب أن لايتجاوز عدد الحروف فيه 8 ب) التصغيرات وهي تخص الأوسام :- - : وسم البداية و وسم النهاية إجباريان 00: وسم البداية و وسم النهاية اختياريان- 0 : وسم البداية إجباري 0 - : وسم النهاية إجباري فيما يلي سوف نقدم أمثلة لتوضيح مفهوم التصغيرات فعلى سبيل المثال لنأخذ كاتب أقوم المسالك في معرفة أحوال الممالك لخير الدين التونسي فإذا كان الوسمين إجباريان فسنحصل على:>عنوان< أقوم المسالك في معرفة أحوال الممالك >/عنوان< >مؤلف<خير الدين التونسي >/مؤلف<أما إذا كان الوسمين إختياريان فسنحصل على : أقوم المسالك في معرفة أحوال الممالك , خير الدين التونسي أما إذا كان وسم البداية إجباري فسنحصل على :>عنوان< أقوم المسالك في معرفة أحوال الممالك>مؤلف<خير الدين التونسيأما إذا كان وسم النهاية إجباري فسنحصل على :أقوم المسالك في معرفة أحوال الممالك >/عنوان< خير الدين التونسي >/مؤلف<ت) تركيبة المحتوى : وهو تحديد لنوعية البينات المدرجة بين واسمي العنصر و يمكن أن يكون محتوى معلن أو محتوى مركبا أو محتوى مختلط وفي ما يلي سوف نستعرض بالتفصيل مختلف هذه الأنواع :ü المحتوى المعلن و الذي يستطيع أن يأخذ إحدى هذه القيم التالية : #EMPTY : عنصر فارغ ( معلم البداية إجباري) CDATA # : نص فقط وسم النهاية إجباري # RCDATA: نص قابل لتعويض PCDATA #: نص SGML يمكن أن يحتوي أوسمة مختلفة # ANY: نفس مكونات PCDATA مهما كان العنصر مثال : < !ELEMENT جملة - 0 CDATA # > < !ELEMENT عنوان - 0 CDATA # > < !ELEMENT ملاحظات - 0 ANY # > ü المحتوى المركب : وهو محتو ى يقوم بإستعمال عناصر معلنة أو عناصر معلنة و مركبة ,{ إسم العنصر , مؤشر مرات الإستعمال}* ׀ {محتوى مركب, مؤشر مرات الإستعمال}* ,)مثال : < !ELEMENT فقرة - - ( جملة +) >< !ELEMENT نص - - عنوان , ملاحظات +, فقرة+ > ü المحتوى المختلط : يمكن أن يكون المحتوى في آن واحد معلن و مركب : < !ELEMENT فقرة - - ( PCDATA ׀ عنوان , فقرة+) > 3.3.2.2.2 خــاصــية SGML : إن العنصر SGML يمكن أن تكون له خاصية إجبارية أو إختيارية مثال : < فقرة STATUT = خاص > السيد علي ..... </ فقرة> إذا فهذه الفقرة لن تكون ظاهرة إلا لبعض الأشخاصونعلن على الخاصية بإستعمال الصيغة التالية < !ATTLIST , العنصر , إسم الخاصية ,( نوع الخاصية ׀ قيمة الخاصية ) , القيمة الضمنية ؟ >و فيما يلي سوف نجرد :1- أنواع الخاصيات الممكن أن تلحق بعنصر ما :< !ATTLIST , العنصر , إسم الخاصية ,( نوع الخاصية ׀ قيمة الخاصية ) , القيمة الضمنية ؟ >مجموعة حروف CDATAإسم وحدة ENTITYقائمة أسماء الوحدات ENTITIESمعرف SGML ID إحالة على معرف IDREFإحالة على معرفات IDREFSإسم NAMEأسماء NAMESوحدة لفضية إسمية NMTOKENقائمة وحدات لفضية إسمية NMTOKENSإسم الملاحظة NOTATIONرقم NUMBERأرقام NUMBERSوحدة لفضية رقمية NUTOKENقائمة و حدات لفظية رقمية NUTOKENS2- القيمة الضمنية : < !ATTLIST , العنصر , إسم الخاصية ,( نوع الخاصية ׀ قيمة الخاصية ) , القيمة الضمنية ؟ >الخاصية لها قيمة واحدة ثابتة #FIXEDلأبد من وجود #REQUIREDالقيمة الأكثر حداثة #CURRENT #CONREFإذا لم تعطى قيمة فإن النظام يجب أن يعطي واحدة #IMPLIED3.3.2.2.3 وحدات SGML : وحدات SGML هي مجموعة من الحروف و الأرقام التي يمكن أن تستعمل كمكون واحد وهي تنقسم إلى:1- الوحدات العامة الوحدات العامة تمكن من تعويظ جملة تظهر في أكثر من مكان داخل الوثيقة بدون اللجوء للبحث عنها و تغييرها داخل الوثيقة والتي يتم الإعلان عنها داخل DTD كما يلي : < !ENTITY , إسم الوحدة , محتوى الوحدة > مثال : < !ENTITY , سج, سلسلة جبال الأطلس> و تستعمل داخل النص الموصف بهذا الشكل : <فقرة> إن &سج تمتد من المحيط الأطلسي غربا إلى البحر المتوسط شرقا و يبلغ إرتفاع أعلى قمة .....</فقرة> و تظهر في النص النهائي على هذا الشكل : إن سلسلة جبال الأطلس تمتد من المحيط الأطلسي غربا إلى البحر المتوسط شرقا و يبلغ إرتفاع أعلى قمة ..... ومحتوى الوحدات العامة يمكن أن يأخذ العديد من الأشكال :أ) محتوى نصي وهي الحالة الأكثر شيوعا ب) تحديد و حدة محلية خارجية محتوى = SYSTEM , مؤشر النظام < !ENTITY , رسم SYSTEM "رسم.gif c:image "ت) تحديد وحدة عمومية محتوى = PUBLIC , مؤشر عمومي , مؤشر النظام ث ) المحتوى : بيانات محتوى = SYSTEM , مؤشر النظام , نوع , تدوين نوع : ü CDATA (Character DATA ) : محتوى التعويض نص (… TEX,POSTSCRIPT) والذي سوف يستعمل من خلال محلل خاص خارجي عن النظام ü SDATA ( Specific DATA ) : محتوى التعويض نص سوف يستعمل من خلال محلل داخل النظام ü NDATA ( Non sgml DATA ) : محتوى ليس نصا ( Bitmap, *.exe,... )تدوين : تبين كيف سيتم إستغلال البيانات ث) المحتوى تعليمات محتوى = PI , أوامر خاصة هذه الأوامر يقع تجاهلها داخل sgml و تقع معالجتها من خلال برنامج مستقل مثل word وهذه الأوامر ليست أساسية و لكنها مفيدة جدا لإعطاء الشكل النهائي للنص2- الوحدات الحرفية : هذه الوحدات تمكن من الرجوع إلى أي حرف خاصة الحروف الغير قابلة للطباعة و التي لا توجد على المزرة يتم الإعلان عليها حسب الشكل التالي :&#, } رقم الحرف ׀ عمل الحرف { مثال : &#91 ؛ يعني TAB ث) الوحدات القياسية : الوحذات القياسية تمكن من القيام بعملية الإستبدال داخل تعريف الأوسام ولها نفس محتوى الوحدات العامة ولكنها غالبا ما تكون نص SGML ويتم الإعلان عنها بهذه الصيغة : > !ENTITY , % , إسم الوحدة , محتوى الوحدة < مثال : > !ENTITY , % , جزء (عنوان, فقرة +) < الإستعمال : > !ELEMENT مقدمة - - ( % جزء+ | PCDATA ) < وهكذا نكون تقريبا قمنا بتقديم أهم مكونات و قواعد الأنموذج (DTD ) و إن أشهر DTD وضع إلى حد الآن هو HTML . 3.3.3 النص SGML : وهو يحتوي على نص المؤلف و الأوسام.يجب أن تحترم القواعد التي تم ضبطها داخل DTD أثناء عملية توسيم (توصيف أو تأشير) النصيجب أن يكون مهيكلا حسب عناصر و كل عنصر يجب أن يكون محاطا ب : معلم بداية > إسم العنصر< (> عنوان< ) معلم نهاية > /, إسم العنصر < (> / عنوان<)- بعض العناصر يكون لها خاصيات معينة - إسم و بنية العنصر معرفان في DTD - يمكن داخل النص أن تقع الإحالة على وحدات عامة ( داخلية و خارجية ) تكون دائما معرفة داخل DTD و تكون الإحالة حسب هذه الصيغة : &, إسم الوحدة , - يمكن أن يحتوي النص على تعليمات خاصة مجهولة بالنسبة ل SGML و تقع معالجتها عن طريق برامج محددة 3.4 مثال تطبيقي و الآن سنقوم بتطبيق كل ما قدمناه بتقديم مثال لوثيقة بسيطة و هي رسالة أعمال و سوف نبتدأ بضبط البنية المنطقية و من ثمة نقوم بإنشاء DTD خاص بهذا النوع من الوثائق لأنه يجب تحديد الوحدات المنطقية المكونة لوثيقة ما لنتمكن من إنشاء DTD و ثم سنقوم توصيف رسالة حسب هذا DTD- البنية المنطقية لرسالة أعمال : DTD ( ملف : رسالة. dtd ) :< !DOCTYPE رسالة ] < !ENTITY سلام " تقبلوا أطيب تحياتي القلبية " >< !ELEMENT رسالة - - (صديرة , الجوهر , النهاية ) >< !ATTLIST رسالة معرف الرسالة ID #REQUIRED >< !ELEMENT صديرة - 0 ( التاريخ , الباعث, المرسل إليه*, الموضوع ؟ ) > < !ELEMENT الجوهر - 0 ( فقرة +) > < !ELEMENT النهاية - 0 ( تحية, (الإمضاء& (إسم الباعث& خطة الباعث؟)))>< !ELEMENT ( التاريخ, المرسل, المرسل إليه , الموضوع) - 0 #PCDATA >< !ELEMENT ( فقرة , تحية ,إسم المرسل , خطة المرسل ) - 0 #PCDATA >< !ELEMENT الإمضاء - 0 #EMPTY >< !ATTLIST الإمضاء أنظر ملف ENTITY #REQUIRED >[ > توصيف الرسالة :< !DOCTYPE رسالة SYSTEM < !ENTITY إمضاء محمد العابد SYSTEM C : signat.gif >[< رسالة معرف الرسالة = 1 > < الصديرة > <التاريخ> 15-.7-.3 </التاريخ> <المرسل> الإدارة </المرسل> < المرسل إليه> علي أحمد </المرسل إليه> <الموضوع> مراكز مصادر التعلم </الموضوع> </الصديرة><جوهر> <فقرة> أأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأ......... ....أأأأأأأأأأأأأأأأأأأأأأأ</فقرة> <فقرة> ببببببببببببببببببببببببببببببببب.............بببب ببببببببببببببب</فقرة> <فقرة> تتتتتتتتتتتتتتتتتتتتتتتتتتتتتتتتت..............تتت تتتتتتتتتتتتتتت</فقرة></جوهر> <النهاية> <تحية> &سلام؛</تحية> <الإمضاء أنضرملف = &محمد العابد> < خطة المرسل> المدير العام </خطة المرسل> </نهاية></رسالة> 3.5 الخلاصة : إن SGML لغة مرنة جدا وناجعة فهي تمكننا من هيكلة و توصيف آلاف الأنواع من الوثائق التي ينتجها الإنسان خلال ممارسة نشاطاته إبتدائا من المخطوطات ووصولا إلى الوثائق التقنية الخاصة بصناعة هياكل الطائرات و لكن في المقابل فإن إنشاء أنظمة SGML هو أمر غاية في التعقيد و مكلف جدا جدا مما جعل هذه التطبيقات حكرا على المنضمات العالمية مثل الأمم المتحدة أو كبريات دور النشر العالمية و كذلك لا يفوتنا أن نذكر بأن SGML نشأ داخل بيئة النشر أي في الحققية نتحدث عن سلسلة SGML حيث أن كل من DSSSL و SPDL هي لغات متكاملة كليا لكي تمكن من الطباعة و النشر و هذا ما جعل SGML فقيرا فيما يخص إنشاء الروابط و التصرف في النصوص الفائقة نظرا لأن كل من يعرف هذه اللغة يدرك مدى صعوبة و تعقيد عملية إنشاء الروابط التشعبية إعتمادا على SGML كما أن عملية التصقح لوثائق SGML تستلزم تحميل DTD و الذي يكون عادة ضخما فيجعل عملية التصفح ثقيلة جدا إذا فكل هذا جعلSGML غير ملائم للواب و لو أننا نشهد الآن ظهور بعض التطبيقات لكنها حكرا على فئة مختصة جدا.إذا فمحاولة تجاوز محدودية HTML و الإستفادة من غنى و مرونة SGML بدون الوقوع في تعقيدات هذا الأخير تم إنشاء XML 4 اللغة التأشير المتوسعة XML4.1 لمحة تاريخية والتعريف إن لغة التأشير الموسعة XML ( EXTENSIBL MARCUP LANGUAGE ) تم وضعه من قبيل فريق عمل] XML Working Group [ (في البداية عرف بإسم هيئة فحص .... SGML ] SGML Editorial Review Borard [ ( تحت إشراف w3c سنة 1996 و تم الإعلان النهائي على هذه اللغة في 10 فيفرييه 1998 وهي صورة مخففة أو مبسطة من SGML حيث تم حذف أغلب الخيارات حتى يسهل إستعماله وهو أكثر مرونة من HTML حيث أن الأوسام غير محددة مسبقا مما يجعله أكثر ملائمة لأصناف متعددة من الوثائق 4.2 الأهداف - لغة XML وضعت خصيصا للإنترنت و الإنترانيت - نشر وثائق SGML بدون الحاجة إلى كتابة DTD .-إستقبال و معالجة وثائق SGML دون معرفة DTD . -يجب على XML أن يمكن من تأشير العديد من أصناف الوثائق -يجب أن تكون تطبيقات XML سهلة الإحداث وهذا يعني : يجب أن تكون صياغة وثيقة XML سهلة يجب أن تكون عملية إعداد برنامج يمكن من إنشاء و تصفح وثائق XML سهلة - يجب أن تكون لغة XML متوافقة مع SGML - يجب أن تكون لغة XML بسيطة ( التقليل من عدد الخصائص الإختيارية ) - يجب أن يكون النص المكتوب بلغة XML قابلا للقرائة ( على الأوسام أن تكون ذات دلالة )4.3 الفــــروق بين XML و SGML 4.3.1 داخل الأنموذج - ليس هنالك إعلان SGML ( تركيبة XML ضمنية ) - ليس هنالك إستثناء (التلازم , عدم التلازم ) داخل DTD - إختفاء بعض أنواع الخاصيات مثل ( NAME(S),NUMBER(S),NUTOKEN(S) )- ليس هنالك تصغيرات كل المعالم واجبة - ليس هنالك قيمة ضمنية من نوع : CURRENT , CONREF - ليس هنالك إعلان عن وحدات CDATA , SDATA , SUBDOC- التخلي عن خيارات مثل : CONCUR , Link 4.3.2 مفــــهوم الوثيقة حسنة الإنشاء : إن الوثيقة الحسنة الإنشاء هي وثيقة تكون بنيتها معبر عنها من خلال توسيمها و يمكن إعتبارها شجرة عناصر حسنة التضامم إن DTD الوثيقة حسنة الإنشاء يمكن أن يكون مجهولا ( غير موجود ) و بالتالي فوثبقة XML تبقى قابلة للإستغلال بدون DTD و بالتالي فهي ليست بالضرورة صالحة من ناحية SGML . 4.3.3 XML يستعمل UNICODE : إن UNICODE هو شفرة الحروف المرجعية بالنسبة ل XML 4.4 أمثلــــــة :4.4.1- سوف ننشأ وثيقة XML تخص ملف أحد المرضى في المستشفى ملاحظة: إن الأوسام (المعالم) لايمكن أن تكون باللغة العربية بالنسبة للXML< encoding = "UTF-8 " " ?XML version ="1.0 >< !DOCTYPE patient [< ! ELEMENT patient (ecivil, diag, exam+, soin+)>< ! ELEMENT ecivil (name, forname+, photoid ? , adresse , tel?, birth )>< ! ELEMENT name (#PCDATA)>< ! ELEMENT forname (#PCDATA)>< ! ELEMENT photoid (#EMPTY)><! ATTLIST photoid XML-LINK CDATA #FIXED “ SIMPLE”>------------------------------------------------------------------------------]><patient> <ecivil> <name> محمود </name><forname> العباسي </forname> <adresse> 21 شارع بيرم التونسي,2100 قفصة </adresse> <tel> 216 71 740 474 </tel><birth> 24-10-1959 </birth> <photoid sysad HREF = “http://www.rabta.tn/photo/Mahoud.gif”><diag>إلتهاب السحايا </diag> ------------------------------------</patient> 4.4.2 إعداد وثيقة XML لتسجيلة ببليوغرافية مطابقة لل UNIMARC : كما تعلمون فإننا لن نتعرض ل145 حقلا المستعملة داخل هذا التقنين بل سنكتفي بعض الحقول فقط وهذه ليست إلا إمكانية مبسطة نسوقها كمجرد مثال< ?XML version = "1.0" encoding = "UTF8">< !DOCTYPE Notice Marc [< !ELEMENT 001 #PCDATA>< !ELEMENT 010 (010a,010b)>< !ELEMENT 010a #PCDATA>< !ELEMENT 010b #PCDATA>< !ELEMENT 101 101a>< !ELEMENT 101a #PCDATA>< !ELEMENT 102 102a>< !ELEMENT 102a #PCDATA>< ! ELEMENT 200 (200a, 200b, 200g,200f)> < !ELEMENT 200a #PCDATA>< !ELEMENT 200b #PCDATA>< !ELEMENT 200g #PCDATA>< !ELEMENT 200f #PCDATA>< !ELEMENT 210 (210a,210b,210d)> < !ELEMENT 210a # PCDATA>< !ELEMENT 210b # PCDATA>< !ELEMENT 210d #PCDATA> ..< !ELEMENT 700 (700a, 700b)>< !ELEMENT 700a #PCDATA>< !ELEMENT 700b #PCDATA>< !ELEMENT 801 (801a, 801b, 801c)><!ENTITY CONT " تونس ">< !ENTITY Agency " المكتبة الوطنية التونسية ">< !ELEMENT 801a #CDATA > < !ELEMENT 801b #CDATA>< !ELEMENT 801c #CDATA>.………………………………………)]< Notice Marc> <001 >معرف التسجيلة </001> <010> <010a>ردمك</010a> <010b>الثمن </010b> </010> <101> <101a> لغة النشر</101a></101> <102> <102a> بلاد النشر</102a></102> <200> <200a> العنوان </200a> <200d> العنوان الموازي </200d> <200 e> المؤلف </200 e > <200 f> بيان المسؤولية الثناوية </200f> </200> <210> <210a> مكان النشر </210a> <210b>عنوان الناشر </210b> < 210c>الناشر </210c> < 210d>تاريخ النشر </ 210d> </210> . . <700> <700a> إسم المؤلف </700a> <700b> الإسم العائلي </700b> </700> < 801> <801a> &contry </801a> <801b> &Agency</801b> </801>-------------------------------------------------</ Notice Marc>4.5 XML و تنوع ا لروابط التشعبية :4.5.1 تعريف الرابط التشعبي : الرابط التشعبي هو رابط بين وحدات مثل الوثائق و أجزاءا من الوثائق يعبر عن علاقة منطقية بين مختلف هذه الوحداتكل رابط تشعبي يجب أن يكون له على الأقل طرفين 4.5.2 أنواع الروابط داخل XML :يعتبر تنوع الروابط التشعبية من أهم نقاط قوة لغة XML - الروابط آحادية و ثنائية الإتجاه - الروابط المحددة خارج الوثيقة- روابط التجميع - روابط التحويل و الإدماج - الروابط الحلقية و المتعددة النوافذ- الروابط المحددة ديناميكيا كل هذا التنوع سمح بظهور لغة داخل XML خاصة بالروابط و هي XLL (Extensible Linking Language ) 4.5.3 تعريف الروابط داخل XML إن الرابط هو عنصر XML و يعرف إعتمادا على الخاصية XML-LINK التي يمكنها أن تأخذ خمسة قيم وهي : SIMPLEEXTENDEDLOCATORGROUPDOCUMENTخصائص أخرى تضاف إلى الرابط :Attribut ROLE : مدلول الرابط Attribut HREF : عنوان المصدر ( URL أو URN )Attribut TITLE : تدقيق نوعية المصدر Attribut SHOW و يمكن أن يأخذ ثلاث قيم وهي :NEW : التصفح يتم في صفحة جديدة EMBED : يجب أن تنشر صفحة الهدف داخل صفحة الإنطلاق في مكان الرابط REPLACE : تقع عملية تعويض لصفحة الإنطلاق بصفحة الهدف عند ضغط الرابط Attribut ACTIVATE : هذه الخاصية تضبط شروط تفعيل الرابط AUTO : يتجه المبحر مباشرة إلى طرف الرابط USER : تقع عملية تنشيط الروابط من طرف المستفيد 4.6 مفهوم المصدر العالمي للأسماء (Universal Ressource Name ) : لا شك في أن كل من تعود الإبحار على الإنترنت يعلم عدد الروابط الغير صالحة للإستخدام و ما تسببه من شعور بالخيبة خاصة عندما نقضي وقتا طويلا في البحث عن معلومة معينة ثم يتبين لنا أن الصقحة لم تعد موجودة في مكانها و إن بعض الإحصائيات تشير إلى أن نسبة الروابط الغير صالحة تصل إلى 80% من العدد الجملي للروابط الموجودة على الواب . و سبب هذه المشكلة هو أن نعتمد على العنونة الفيزيائية للوثاق Universel Ressource Locator و التي تعتمد على إسم الموزع الذي توجد بداخله الوثيقة وبذلك فبمجرد إستبدال موزع الإيواء نفقد صلوحية الرابط و URL له الصيغة التالية الأسلوب : // إسم الموزع: المنفذ / الملف] # إسم المشير داخل الملف | ؟معلمات (الأسئلة)[الحل المقترح هو :العنوان المنطقي لمصدر ما وهو يتكون من: إسم المجال , إسم الوثيقة وهكذا فلو أنه تم إستبدال الموزع فيمكن دائما الوصول إلى الوثيقة لكن هذه التقنية مازالت في طور التجربة و سو ف نقدم عنوان موقع مجلة المعلوماتية كمثال URL :http://www.moe.gov.sa/stdafrs/librar...s/index.htmURN العنوان المنطقي : //moe:: stdafrs// DOCUMENT index.htm//sa 4.7 برامج معلوماتية تخص XML :برامج تخص إنشاء وثائق XML : - شركة MICROSOFT أدخلت XML على كل برامج OFFICE إذا فيمكن إنشاء وثيقة XML بإستعمال برنامج wordVisual XML - http: // www.pierlou.com/visxml/ :برامج تخص تصفح وثائق XML : - Inertnetexplorer إبتداءا من النشرة 5.5 تحت نضام التشغيل windows - mosaique تحت نضام التشغيل LUNIX - MAYA و هو برنامج تصفح تم إحداثه من طرف w3c5- تجـــارب و تطبيقـــــات XML : لقد شهد XML تطبيقات في عديد المجالات بهدف تسهيل عملية تبادل الوثائق بين المختصين في نفس المجال نخص بالذكر منها :MATHML - (Mathematical Markup language) وهو أنموذج حسب XML لتوصيف وثائق العلوم الرياضية و يمكن الإطلاع على هذه اللغة على العنوان التالي : http://www.w3.org/TR/REC-MathML/CM L - ( Chemical Markup Language) وهو أنموذج حسب XML لتوصيف وثائق العلوم الكيميائية ويمكن الإطلاع على هذه اللغة على العنوان التالي : http://www.xml-cml.org/- كما إن ل XML تطبيقات عديدة داخل عالم المكتبات ومن بين هذه التطبيقات نشير إلى مشروع BIBLIOML الذي تشرف عليه وزارة الثقافة الفرنسية و هو تطبيق XML لتوصيف التسجيلات الببليوغرافية المطابقة لل UNIMARC و يهدف في مرحلة أولى إلى إنشاء فهرس موحد للمكتبات الفرنسية في مجال علوم الأرض ويمكن الإطلاع عل هذا المشروع و تحميل DTD الذي و قع إنشاءه على العنوان التالي : http://www.biblioml.org/- إستعمال XML كشكل بديل عن ISO2709 لتبادل المعطيات الببليوغرافية : نذكر على سبيل المثال البرنامج التوثيقي WINISIS الصادر عن UNESCO في نشرته 1.4 يمكننا من إسترجاع التسجيلات الببليوغرافية حسب XML 6- الخـــــلاصـــــــــة :إن لغة XML ورثت مميزات كل اللغات التوصيفية التي سبقتها و تجوازت مجمل نقائصها مما جعلها لغة المستقبل للبيئة الرقمية و بما أن عالم المكتبات هو عالم مفتوح يهدف إلى تسهيل تبادل المعلومات و إيصالها للمستفيدين إذا فإن XML هي لغة ملائمة جدا لقطاع المكتبات و قد عرضنا بعض هذه التطبيقات لكن التعمق في هذا الموضوع يتطلب مقال منفرد .7 - المــــصــادر - أتوجه بالشكر إلى الأستاذ Jean-Marie. Pinon الذي بفضل إرضائه لفضولي العلمي تمكنت من إستيعاب بعض المفاهيم التي ساعدتني على كتابة هذا المقال- بالنسبة للمصطلحات العربية فقد و قع إعتماد : - مشروع معجم مصطلحات المعلوماتية : إنجليزي- فرنسي-عربي / المنظمة العربية للتربية و الثقافة و العلوم - المواقع العربية التي تتطرق إلى نفس المواضيع - HTML عربي- http://www.arabbuilder.com/learn/lessons/html/index.php - http://www.khayma.com/hpinarabic/htmintro.html- إفرنجي - http://www.w3.org/MarkUp/Activity - http://www.yourhtmlsource.com/starthere/whatishtml.html - http://www.utoronto.ca/webdocs/HTMLd...tmlindex.html- XML - عربي- http://www.dev4arabs.com/ar/xml/ http://linux.atlink.it/linuxfocus/Ar...icle242.shtml- إفرنجي- http://www.w3.org/XML/- http://babel.alis.com/web_ml/xml/REC-xml.fr.html- http://www.ucc.ie:8080/cocoon/xmlfaqحسن عليةالمستوى العلمي : متحصل على شهادة المرحلة الثالثة لدراسات العليا المتخصصة في التصرف في المكتبات التكوين الأساسي متحصل على شهادة الأستاذية في الرياضيات












  رد مع اقتباس
قديم Feb-28-2004, 03:21 AM   المشاركة5
المعلومات

عبدالله الشهري
مشرف
منتديات اليسير

عبدالله الشهري غير متواجد حالياً
البيانات
 
العضوية: 2170
تاريخ التسجيل: Dec 2002
المشاركات: 2,009
بمعدل : 0.26 يومياً


افتراضي

وعليكم السلام ورحمة الله وبركاته
تحية طيبة أخي العزيز حسن وسعيد جداً بهذا المشاركة النوعية والتي تتناول نوعاً من أنواع لغةالبرمجة: لغةXML
ولا يسعني هنا غيرأن أقدم لك الشكر والتقديرعلى هذا الجهد.
تحياتي لك.
__________________________________________________ ________
سُبْحَانَكَ لاَ عِلْمَ لَنَا إِلاَّ مَا عَلَّمْتَنَا إِنَّكَ أَنتَ الْعَلِيمُ الْحَكِيمُ












  رد مع اقتباس
قديم Mar-06-2004, 09:53 PM   المشاركة6
المعلومات

حسن علية
مكتبي فعّال

حسن علية غير متواجد حالياً
البيانات
 
العضوية: 377
تاريخ التسجيل: Aug 2002
الدولة: السعـوديّة
المشاركات: 111
بمعدل : 0.01 يومياً


افتراضي xml و البيانات الببليوغرافية

تحية طيبة
و تبعا لمشاركة الأخيرة حول لغة التأشير xml و لكي تتم الفائدة فهذه مشاركة ثانية و التي من خلالها سأحاول أن أقدم بعض تطبيقات xml في عالم البيانات الببليوغرافية XML و البيانات الببليوغرافية؟التخطيط :1-المقدمة 2-تقانين وصف و تبادل المعلومات الببليوغرافية الرقمية 3 - مميزات XML 4- إتجهات تطبيقات XML 5-توصيات الإتحاد العالمي للمكتبات6-XML و الوثائق العربية 1 المقدمةلقد كان دائما هم الساهرين على المكتبات هو إيجاد أنجع الوسائل لتقريب و تقديم المعلومات الكاملة و المفصلة عن الرصيد الببليوغرافي بطريقة ميسرة للمستفيدين لأن هدف المكتبات هو نشر المعرفة إذا فنجاحها يقيم بنسبة الرصيد الببليوغرافي المتداول و هذا ما يفسر ظهور التقانين الخاصة بالمكتبات منذ الستينات من القرن المنقضي مثل تقانين الوصف الببليوغرافي (تدوب,ك , م,......) و التي تهدف إلى توحيد معايير المستعملة لإنشاء الفهارس مما يمكن القارئ من البحث داخل الفهارس بدون أي معرفة بتقاليد خاصة بمكتبة معينة و يمكن أن يجد المعلومة حتى وهو يجهل لغة الفهرسة و بإنتقال مجال النشاط الفكري البشري من البيئة الورقية إلى البيئة الرقمية إنتقلت تبعا لذلك خدمات المكتبات إلى البيئة الجديدة و في أول الأمر كانت رقمنة فهارس المكتبات ونشهد اليوم ظهور مكتبات بكل خدماتها على الواب (المكتبات الافتراضية ) و تطلب هذا الإنتقال إنتقال التقانين التي تسهل وتمكن من تبادل المعلومات الببليوغرافية إلى البيئة الجديدة مما أدى إلى ولادة التقانين الببليوغرافية الرقمية و التي إبتدأت بظهور المارك بمبادرة مكتبة الكونغرس الأمريكية ثم شهدنا تفرعات قومية عن هذا التقنين خاصة بكل دولة حتى كدنا أن نفقد إمكانية تبادل المعلومات مما حدى بالإتحاد الدولي للمكتبات IFLA إلى إصدار UNIMARC كمعيار موحدا لتبادل المعلومات الببليوغرافية و كانت هذه التقانين في أول الأمر تهدف إلى التمكين من العمل داخل شبكات محلية و متخصصة ولكن مع ظهور الفضاء العالمي الواب الذي قرب بين مختلف المهن وقرب بين من لهم نفس الإهتمام مما أحدث تحولات عميقة في مجال معالجة المعلومات بإتجاه توحيد التقانين و المواصفات بين مختلف المهن و المجالات لكن المكتبات تعاني من مشكلة إندماج داخل هذا الواقع الجديد نضرا لاستئثارها بتقانين و مواصفات خاصة بها مما جعلها معزولة نوعا ما على باقي المهتمين بنفس القطاع ( صناعة الكتاب) إذ أنه لا يمكن إستعمال و معالجة المعطيات الببليوغرافية إلا من خلال يرمجيات توثيقية قادرة على التعامل مع هذه التقانين فالسؤال الذي يطرح نفسه هل بعد ظهور لغة الواب الموحدة XML مازلنا في حاجة للمارك و ISO 2709 2 تقانين وصف و تبادل المعلومات الببليوغرافية الرقمية 2.1 تقنين الفهارس المقروءة آليا MARC لقد شهدنا ولادة المارك Machine Radebal Catalogue في الستنيات من القرن الماضي تحت إشراف مكتبة الكونغرس الأمريكية و هو يهدف إلى هيكلة المعطيات الببليوغرافية داخل قواعد البيانات حسب حقول وحقول فرعية حتى نضمن توحيد شكل تخزين المعطيات و نضمن حد أدنى من التطابق في معالجة الوثائق ( كتب, دوريات , ......).و تتكون التسجيلة الببليوغرافية حسب هذه الهيكلة من : 2.1.1 الأقسام :تنقسم التسجيلة إلى عشرة أقسام و كل قسم يمكن أن يحتوي على 100 حقل إي في أقصى الحالات يمكننا أن نحدث 1000 حقل وفي الواقع لم يقع إستعمال أكثر من 200 حقل إلى حد اليوم و(إن الأمثلة المقدمة ستكون من UNIMARC و لكن التركيبة تنطبق على كل أنواع المارك ( Marc21, ,USMarc , InterMarc........) إن الإختلافات تنحصر في تسمية الأقسام أو الحقول) و الأقسام بالنسبة للUNIMARC هي التالية : 0XX : أرقام التعريف 1XX : المعطيات المشفرة 2XX : الوصف الببليوغرافي 3XX : الملاحظات 4XX : الروابط 5XX : العناوين مضافة (تابعة) 6XX : الفهرسة الموضوعية 7XX : المسؤولية الأدبية 8XX : المعطيات العالمية 9XX : المعطيات المحلية 2.1.2الحقول : إن الحقل يتركب من:- رقم الحقل وهو عدد يتكون من ثلاثة أرقام مثل :001 : رقم الواصفة 010 : الرقم الدولي الموحد للكتب 100 : معطيا ت مشفرة 101 لغة الكتاب مشفرة102 : بلاد النشر مشفرة 200 : العنوان و بيان المسؤولية205 : الوصف المادي 300 : ملاحظات عامة ....- مشيرين : إن المشير يمكن من تحديد خاصيات المعطيات داخل الحقل وكل مشير يتكون من حرف واحد محدد مسبقا في قائمة كما يمكن أن يكون مجرد بياض فمثلا بالنسبة للحقل 200 فإن المشير1 ( ind.1 ) وهو يرمز إلى أن العنوان ذا معنى أو لا فالقيمة :0 العنوان غير ذا معنى 1 العنوان ذا معنى المشير2 (ind.2 ) لا يرمز لأي شيئ و قيمته بياض - الحقول الفرعية وهي خاصية تميز قواعد البيانات الببليوغرافية و هي تمثل وحدات لايمكن تقسيمها فمثلا الحقل 210 يمثل العنوان الببليوغرافي و هو ينقسم كالآتي 210$a : مكان النشر210$b : عنوان النشر210$c : الناشر210$d : تاريخ النشر 210$e : مكان الطباعة 210$f : عنوان الطباعة .....و يمكن الإطلاع على هيكلة المارك 21 في العنوان التالي : http://www.loc.gov/marc/specifications/specrecstruc.html ولا يمكننا أن نتحدث عن MARC بدون الحديث عن تبادل البيانات الببليوغرافية إي الحديث عن ISO2709 خاصة إذا علمنا أنه تم إنشاء MARC مطابقا للISO2709 الذي يمكننا أن نعتبره هيكل لتبادل المعلومات 2.2 تركيبة واصفة حسب ISO2709 : تعود نشأة ISO2709 إلى فترة تبادل المعطيات المعلوماتية على شكل ملفات والوصول للمعلومات بصفة ممتتالية بإستعمال التسجيلات الممغنطة و هو يمكن تخزين المعلومات على شكل نص مكثف يحتوي على البيانات الببليوغرافية و الحد الأدنى من المعطيات التي تمكن من إعادة بناء الواصفة داخل نظام آخر وقد صدر عن المنضمة الدولية لتقنين ISO لأول مرة سنة 1973 وشاهد الإصدار الثاني سنة 1981 وشاهد آخر مراجعة سنة 1996 مثال لتسجيلة ببليوغرافية مستمدة من الفهرس الموحد للمكتبات الجامعية التونسية : 00618nam a2200181 45000010014000000030007000140050017000210390024000 38101000800062102000700070200015200077210004200229 21500240027161000190029570000690031491000280038391 1002500411?vtls000000021?BIRUNI?20030421225200.0? 9y200304212252zstaff? aara? aLB? aكتاب نزهة المشتاق في اختراق الآفاقfأبو عبد الله محمد.... المعروف بالشريف الإدريسي? aبيروتcعالم الكتبd1989? a14796(1-2)d24سم.? aجغرافيا? aالإدريسيbأبو عبد الله محمد , الشريف? aDocumentalistebPrénom? aSuperviseurbPrénom? تتكون الواصفة الببليوغرافية من جزئين : 2.2.1 الجزء المشفر وهو عبارة عن بطاقة هوية التسجيلة و يتكون من :- العلامة (Label ) : تتكون 24 حرفا موزعة كالآتي من الوضعية 0 إلى 4 مخصصة لطول الواصفة الببيوغرافية الوضعية 5 حرف يعبر عن حالة الواصفة ( جديدة, منقحة , .....) الوضعية 6 حرف يعبر عن نوع الوعاء الوضعية 7 حرف مخصص لنوع الوثيقةالوضعية 8 مخصص للعلاقة الهرمية بين الواصفات الوضعية 9 بدون معنى الوضعية 10 حرف مخصص لطول المؤشر ......... الوضعية 18 مخصصة لشكل الفهرسة الوصفية ( مطابقة تماما لISBD , مطابقة جزئيا لISBD , غير مطابقة ل ISBD ) مثال : 00618nam a2200181 4500- الدليل(directory ) و يكون متغير الطول حسب عدد الحقول المستعملة داخل التسجيلة الببليوغرافية و لكنه يتكون من وحدة أساسية تتكون من 12 رقم تتوزع كالآتي : - ثلاثة أرقام لتحديد رقم الحقل الببليوغرافي- أربعة أرقام تحديد طول الحقل - خمسة أرقام لتحديد مكان الحقل منذ بداية الواصفة مثال : 001|0014|00000||003|0007|00014||005|0017|00021||03 9|0024|00038||101|0008|00062||102|0007|00070||200| 0152|00077||210|0042|00229||215|0024|00271|| 610|0019|00295||700|0069|00314||910|0028|00383||91 1|0025|00411||2.2.2 المعطيات الببليوغرافية : و هو عبارة عن محتويات الحقول والحقول الفرعية مرفقة بفواصل متعارف عليها مثال : ?vtls000000021?BIRUNI?20030421225200.0- 9y200304212252zstaff- aara- aLB- aكتاب نزهة المشتاق في اختراق الآفاقfأبو عبد الله محمد.... المعروف بالشريف الإدريسي- aبيروتcعالم الكتبd1989- a14796(1-2)d24سم.- aجغرافيا- aالإدريسيbأبو عبد الله محمد , الشريف- aDocumentalistebPrénom- aSuperviseurbPrénom- 3 مميزات XML إننا سنبحث ثلاث نقاط أساسية بالنسبة لمميزات XML في مجال المعالجة الآلية للمعطيات الببليوغرافية وهي قدرة xml على هيكلة البيانات, تحميل البيانات و تحديد نوع المعالجة اللازمة لكل نوع من المعطيات3.1 XML و هيكلة البيانات: إن XML هو لغة توصيف ذات قدرة عالية على هيكلة البيانات فإن عدد الأوسام غير محدد مسبقا بينما بالنسبة للمارك فعدد الحقول لا يتجاوز 999 ومستوى التضامم غير محدد مسبقا بينما نجده محددا بمستوى واحد بالنسبة للمارك فنجد الحقول و الحقول الفرعية إذا فالهيكلة التي يوفرها XML أكثر شمولية و أكثر دقة مقارنة بال MARC أضف إلى ذلك إمكانية إثراء محتوى الواصفة بإضافة محتوى متعدد الوسائط ( صوتيات , صور,........)3.2 XML و تبادل البيانات الببليوغرافية :إن XML يمكن من تأشير الوثائق على شكل نصا بحت و عندما يكون مرفقا بالأنموذج يمكننا من معالجة هذه المعطيات بمعزل عن الحواسيب و الأنظمة المشغلة لهذا فهو منافس جيد لل 2709 ISO و يتفوق عليه فيما يخص القدرة على قرائة الواصفة إذ أننا نفقد القدرة على قرائة الواصفة مكتوبة على شكل2709 ISO مما يجعلها غير صالحة إلا للقرائة الآلية أما بالنسبة للXML فالمشكل لايطرح .3.3 XML و تدقيق(المصادقة) البيانات :إن XML قادر على تمثيل كل خصائص البيانات المحددة بالنسبة لل MARC و ذلك بإدارجها كخصائص إجبارية أو إختيارية بالنسبة للعناصر (الحقول) مع مرونة أكبر في التعامل مع المعطيات خاصة مع ظهور مفهوم Schema و الذي يمكن من تحديد ترتيب ظهور العناصر داخل الوثيقة ويحدد إجبارية ظهور عنصر ما داخل عنصر آخر أي أنه يمكننا من المصادقة على أن التسجيلة مطابقة للأنموذج مما يوازي قواعد المصادقة المعتمدة داخل المارك . 3.4 الخلاصة : إنن ف XML مطابق لكل المواصفات التي يجب أن تتوفر لإنشاء و التخزين و تبادل الواصفات الببليوغرافية مما يجعله بديلا للMARC و متفوقا عليه فيما يخص أنه لغة الواب المعتمدة و بذلك يمكن من إدماج فهارس المكتبات مع باقي الوثائق الموجودة على الواب ويزيل الحواجز بينها وبين القطاعات الأخرى إذ أن أي برنامج XML يمكنه تحميل و معالجة الواصفات الببليوغرافية 4 إتجهات تطبيقات XML هنالك إتجاهين لتطبيقات XML بالنسبة للبيانات الببليوغرافية و هما : - القيام بإيجاد مقابل لحقول MARC بإستعمال XML و هذا الإتجاه يعتبر حلا بسيطا و هو يعتمد خاصة للقيام بوضع فهرس آلي على الواب وهو الحل المعتمد في الكثير من البرامج التوثيقية مثل برنامج winisis الصادر عن منضمة اليونسكو في إصداره 1.4 كما نجد أن هذه التقنية معتمدة في العديد من بوابات البحث التوثيقية حيث تتم عملية تحويل التسجيلات الببليوغرافية من المارك إلى XML بغاية تسهيل عملية البحث و إسترجاع البيانات الببليوغرافية -القيام تحويل كل مكونات المارك بما في ذلك البنية المنطقية إلى XML و هذا الحل يؤدي إلى إعداد نماذج غاية في التعقيد و قد يصل حجم الأنموذج DTD إلى 10000 سطر و أهم ما تحقق في هذا الإتجاه هو *نماذج مكتبة الكونغرس الأمريكية التي تمكن من إستعمال MARC 21 داخل إطار XML و هذه النماذج تخص المعطيات الببليوغرافية و مداخل المؤلفين و رؤوس الموضوعات و الذي يمكننا تصفحها على العنوان التالي http://www.loc.gov/marc/marcxml.html * أنموذج BIBLIOML الذي و قع إعداده تحت إشراف وزارة الثقافة الفرنسية وهو يهدف إلى إعداد أنموذج XML لواصفات UNIMARC و يمكن إستعماله من طرف أي برنامج قادر على معالجة XML و نجد على العنوان التالي الإصدار 0.3 لهذا الأنموذج http://www.culture.fr/BiblioML/dtds/...tml/index.html 5 توصيات الإتحاد العالمي للمكتبات لقد أفردت IFLA المؤتمر 68 المنعقد بسكتلاندا من 18 إلى 24 أغسطس 2002 لمناقشة إدماج XML في التقنيات الببليوغرافية المعتمدة داخل المكتبات ويمكن الإطلاع على ورقات العمل لهذا المؤتمر على العنوان التالي http://www.ifla.org/IV/ifla68/index-f.htm والذي أقر لجنة متابعة تترأسها المكتبة الوطنية البرتغالية لبعث أدوات ريادية تجسد إمكانية إستعمال xml لإنشاء و تحميل الواصفات الببليوغرافية وهي تتمحور حول :تبادل التسجيلات الببليوغرافية : http://www.bookmarc.pt/tvs/examples/...mples/XMS.xmlو هنالك العديد من التجارب الأخرى التي تخص تبادل البيانات الببليوغرافية و من بينها تجربة مكتبة الكنغرس الأمريكية و التي يمكن الإطلاع عليها على العناوين التالية : http://www.loc.gov/standards/marcxml...cfile.rngتدقيق الواصفات الببليوغرافية : http://www.bookmarc.pt/tvs/examples/UnimarcDoc.xsdمثال لتحويل قواعد المصادقة للقسم 0XX داخل UNIMARC إلى XMLhttp://www.bookmarc.pt/tvs/examples/Unimarc0.xmlالخدمات الببليوغرافية : -تقديم خدمة البحث عن البيانات الببليوغرافية داخل قاعدة بيانات تجريبية تحتوي على أكثر من مليون واصفة عن طريق إحداث برنامج معلوماتي يمكن من إستخدام الأدوات السالفة الذكر http://sirius.bn.pt/sirius/sirius.exe/XML 6 و الوثائق العربية : بما أن XML يعتمد UNICODE للتشفير حروف مختلف اللغات فهو مناسب للغة العربية كما أنه لغة عامة لا تقع تحت طائل الملكية الأدبية فلدينا كل الحرية لإعداد النماذجDTD خاصة بأي تطبيق نريده فهذا يفتح الباب لإيجاد تطبيقات خاصة بموروثنا الثقافي الغني بالمخطوطات التي لها بنى خاصة ( الديباجة أو الحمدلة، الحواشي،.......) والتي ستمثل مشروعا رائدا وذا جدوى كبيرة مما يمكننا من حضور فاعل داخل البيئة الرقمية والمساهمة الإيجابية في الثقافة العالمية روابط مفيدة : http://www.oasis-open.org/cover/marc...ookmarc.pt/tvs












  رد مع اقتباس
قديم Sep-13-2006, 04:56 PM   المشاركة7
المعلومات

AHMED ADEL
مكتبي متميز

AHMED ADEL غير متواجد حالياً
البيانات
 
العضوية: 18689
تاريخ التسجيل: Aug 2006
الدولة: الإمارات
المشاركات: 249
بمعدل : 0.04 يومياً


كتاب XML : هل تغير مستقبل المكتبات الرقمية

هبة عبد الستار مصيلحى
تمهيدي ماجستير - تخصص معلومات - جامعة القاهرة
heba@cybrarians.info
http://www.arabcin.net/modules.php?n...rticle&sid=937
الكلمات الدالة
لغات التحديد ، لغة التحديد القابلة للامتداد eXtensible Mark up Language - XML ، تصميم مواقع المكتبات ، المكتبات الرقمية ، توصيفات البيانات Metadata ، النشر الإلكترونى
مستخلص
تتناول الدراسة تطبيقات لغة التحديد القابلة للامتداد eXtensible Mark up Language XML فى المكتبات الرقمية حيث تبدأ بمقدمة عن تاريخ و تطور لغات التحديد ونشأة لغة التحديد القابلة للامتداد XML وخصائصها والمعايير والأدوات المرتبطة بها ثم تتناول تطبيقاتها فى مجال المكتبات من خلال تصميم مواقع المكتبات على الانترنت ، والنشر الالكترونى و بعض المعايير المرتبطة به ، وإدارة قواعد البيانات الببليوجرافية مع عرض تجارب عملية فى هذا المجال ثم تطبيقاتها فى مجال صياغة وتبادل توصيفات البيانات Metadata من خلال معيار ONIX ومعيار دبلن كور Dublin core وتقنينات المقابلة بين معايير توصيفات البيانات المختلفة ، وكذلك فى مجال الفهرسة مع التركيز على معيار MARC/XML من حيث خصائصه ونشأته وبناءه ثم تتناول علاقتها وامكانات الافادة منها فى مجال تبادل البيانات إلكترونيا EDI وكذلك مجال استرجاع المعلومات من خلال بروتوكول Z39.50 والجيل الثانى منه ZeeRex وأخيرا تتناول بشكل سريع تأثير لغة التحديد القابلة للامتداد على المكتبات الرقمية وإمكانيات الافادة منها فى المكتبات المصرية.
النقاط الرئيسية



النشأة والتطور
المعايير والتطبيقات
تصميم مواقع المكتبات على الانترنت
النشر الإلكترونى
بناء وادارة قواعد البيانات البيليوجرافية
الفهرسة وصياغة وتبادل توصيفات البيانات Metadata
تبادل البيانات إلكترونياًEDI
Z39.50 المشكلة و ZeeRex الحل
XML ومستقبل المكتبات الرقمية
قائمة الاستهلاليات
الهوامش
الاستشهاد المرجعي بهذه المقالة
ارسل تعليق على المقال
النشأة والتطور

تنتمى لغة التحديد القابلة للامتداد(XML) eXtensible Mark up Language الى عائلة لغات التحديد Mark up Languages والتى يمكن تعريفها بأنها لغات لهيكلة النصوص وترميزها بشكل يسهل التعامل معها ومعالجتها آليا وهى لغات ترميز اكثر منها كلغات برمجة بالمعنى المفهوم والمتعارف عليه لكلمة برمجة . حيث نجد قاموس علم المكتبات والمعلومات المتاح على الخط المباشر ODLIS يعرفها كالأتى:

"مجموعة محددة مسبقا من الواصفات سواء كانت (رموز و تيجان ) او طريقة لتعيين وتحديد تلك الواصفات والتى تستخدم فى ادماج وتضمين ايه معلومات خارجية داخل وثيقة نصية إلكترونية و عادة ما تشير الى تحديد شكل تلك المعلومات او لتيسير إجراءات التحليل التى تتم عليها . ولقد صممت لغات التحديد لتعمل مع برامج محددة الا انه قد تم اعتماد لغة التحديد المعيارية العامة SGML كمعيار عالمى فى عام 1986 وبعد ذلك خرجت منها لغة تحديد النص الفائق التى تستخدم فى انشاء صفحات الانترنت . وفى عام 1998 قامت رابطة الشبكة العنكبوتية بالتوصية باستخدام النموذج المصغر من لغة التحديد المعيارية العامة SGML والذى عرف فيما بعد بلغة التحديد القابلة للامتداد XML . وتختلف معظم لغات التحديد عن قواعد البيانات فى قدرتها على تحديد العناصر المتضمنة داخل النص دون تمييز عناصر البيانات المهيكلة الا ان لغة التحديد القابلة للامتداد لديها القدرة على تحويل اى نص الى قاعدة بيانات متكافئة "

ويتضح من التعريف السابق بأن مهمة لغات التحديد تتركز فى ترميز المعلومات وصياغتها فى بناء هيكلى موحد يسهل التعامل معه بواسطة كافة الانظمة والتطبيقات فهى تعنى وتركز على شكل المعلومات وتحديد الاجراءات التى ستتم عليها

واذا نظرنا الى تاريخ لغات التحديد (1) نجد ان البداية كانت فى سبتمبر 1967 خلال اجتماع فى مكتب النشر الكندى الحكومى حيث قام William Tunnicliffe بإلقاء عرض لفكرة جديدة تدور حول فصل محتوى المعلومات عن الشكل الخاص بها وتوافق هذا مع كتابات اخرى فى هذا المجال وبدأ الاتجاه الى فصل الشكل عن المحتوى .

وفى عام 1969 ظهر مشروع GenCode الذى عمل فيه تشارلز جولدفارب الذى كان تحت رعاية شركة IBM ونتج عنه لغة التحديد العامة Generalized Markup Language (GML) وبعد عدة سنوات ومع المزيد من العمل برزت الى النور لغة التحديد المعيارية العامة Standard Generalized Markup Language SGML وبالطبع جاءت لتتغلب على نواحى القصورالتى كانت موجودة فى لغة التحديد العامة من خلال امكانية معالجة الروابط والجمع بين اكثر من نوع للمعلومات معا ومع حلول الثمانينات من القرن الماضى كانت لغة التحديد المعيارية العامة قد انتشرت فى اغلب الشركات والمؤسسات الحكومية فى العالم . وكانت من أوائل اللغات الخاصة بترميز النصوص الفائقة وهيكلتها لغة التحديد المعيارية العامة والتى تم اعتمادها من الايزو عام 1986 واصدرت بشأنها معيار ISO 8879. هذا و لم تنتشر فى بداياتها بين المستخدمين لصعوبتها وتعقدها حيث انها صممت اساساً لتطوير ونشر الوسائط المتعددة وذلك لدعمها لتكامل البيانات المختلفة وتمثيلها بشكل يسهل من التعامل معه لذا هى مفيدة جدا فى إنشاء الصفحات المعقدة والمركبة التى تجمع بين أكثر من نوع وشكل لمصادر المعلومات .

ومن اجل هذا برزت الحاجة الى لغة اسهل وابسط خاصة لخدمة المستخدمين غير المتخصصين والذين يريدون إنشاء صفحات بسيطة لهم فكان ظهور HTML أو لغة تحديد النص الفائق والتى انتشرت بسرعة الصاروخ لسهولة التعامل معها من خلال العديد من البرامج وأدوات تحرير النصوص مثل Microsoft Word حيث كانت تعتمد على التيجان Tags لهيكلة النص فى شكل فقرات وقوائم وروابط فائقة .



ولقد ظهرت هذه اللغات كى تتعامل مع ما يسمى بالنص الفائق او التشعبى Hyper Text الذى اصبح الاسلوب المميز لنوع النصوص المنشورة على الانترنت حيث يتم الاعتماد فيه على الربط بين اكثر من عنصر او كائن داخل الوثيقة مع سهولة الانتقال بين هذه العناصر سواء عن طريق الربط الصاعد او الهابط .

ولقد انتشرت هذه الطريقة فى صياغة النصوص ونشرها مع ظهور الانترنت وتطبيقاتها وبصفة خاصة الشبكة العنكبوتية عندما قام تيم بيرنز لى أحد مديري مؤسسة رابطة الوب او الشبكة العنكبوتية W3C بابتكار اول بروتوكول للنص الفائق يعمل على الانترنت ولهذا يعزى اليه اختراع الوب .



إلا ان فكرة النص الفائق والربط بين النصوص وغيرها من الوسائط او مصادر المعلومات فى اطار واحد تمتد جذورها الى الأربعينات من القرن الماضى وتحديدا الى يوليو عام 1945 عندما أطلق فانيفار بوش الذى كان يعمل وقتها مديرا للمكتب الأمريكى للبحث العلمى والتطوير مقالته الشهيرة "As We May Think" التى وصف فيها تخيلاته ورؤيته للنص الفائق والذى اطلق عليه وقتها اسم "MEMEX" حيث اقترح الربط بين المعلومات مع امكانية وسهولة تعديل واضافة معلومات اخرى خاصة بالمستخدم ولقد تجسدت تلك الأفكار وأصبحت حقيقة مع ظهورالشبكة العنكبوتية التى اصبحت تعتمد بشكل اساسى على بروتوكول النص الفائق HTTP .إلا أنه مع هذا الانتشار الذى وجدته لغة HTMLوالتطوير المستمر الذى كانت تخضع له حتى ظهور أخر اصدار لها HTML 4.0 فى عام 1997 فلقد وجد انها تمثل عقبة فى نشر الوسائط المتعددة فهى تعمل بكفاءة شديدة مع المواد النصية ولكن هناك حاجة ماسة للتعامل مع كافة انواع الوسائط لذا تم تطويرها وإصدار Dynamic HTML او DHTML لتصبح أكثر ديناميكية فى التعامل مع الوسائط المتعددة ونشرها على الانترنت .

ولقد كانت لغات التحديد السابقة تعتمد على المحددات التى كانت تسهل على الحاسب الآلى التعامل مع النصوص داخل تيجان التحديد سواء بالعرض على الشاشة او الطباعة والتعديل إلا ان هذه المحددات او التيجان لا تصف الوثيقة نفسها بكفاءة فلا يمكن مثلا ان يتم تقديم توصيف لكلمة ما فى الوثيقة أو إضافة معناها او ما تدل عليه وكانت هذه المشكلة تبرز أكثر عند استرجاع الوثائق حيث أرجع الكثيرون فشل محركات البحث فى تقديم نتائج جيدة إلى شكل وطريقة هيكلة الوثائق لذا ظهرت XML لتحل هذه المشكلة حيث يمكن من خلالها إضافة توصيف لأى فقرة او كلمة داخل الوثيقة ومن ثم يتحول معها اى مستند الى قاعدة بيانات ضخمة يمكن البحث فيها ومشاركتها مع التطبيقات المختلفة(2) أضف الى ذلك ايضا انها جاءت كنقطة إلتقاء بين لغتى SGML و HTML فهى تسهل من تبادل البيانات بين المصادر التى تمت كتابتها باللغتين السابقتين فهى كما يشير قاموس علم المكتبات والمعلومات المتاح على الخط المباشر :

" مجموعة فرعية من لغة التحديد المعيارية العامة حيث تقوم التيجان بتحديد نوع المعلومات المتضمنه فى عناصر البيانات ( على سبيل المثال : رقم المنتج ، السعر ، ...الخ) وليس مجرد الاكتفاء بتحديد طريقة عرضها وكلمة Extensible او القابلة للامتداد تعنى وتشير الى عدم محدودية تلك التيجان وعدم التقيد فى صياغتها حيث لا يشترط التعريف والتحديد المسبق لها كما هو الحال فى لغة تحديد النص الفائق HTML . حيث يجب انشائها وتحديدها خلال تحليل الوثيقة من قبل منتج او منشىء الوثيقة . ولقد صممت لتفى باحتياجات النشر الالكترونى ، وهى شكل نصى مرن يمكن استخدامه مع لغة تحديد النص الفائق فى نفس الصفحة و تتم هيكلة الوثيقة من خلال وثيقة تعريف النوع او كود اللغة نفسه حيث يمكنها التعامل مع الوثائق الهرمية "

والمسئول عن تطويرها ايضا هى نفس الجهة المسئوله عن اللغات السابقة وهى مؤسسة رابطة الشبكة العنكبوتية W3C وهى عبارة عن مؤسسة مكونة من أكثر من 180 عضواً من منظمات وهيئات تجارية واكاديمية وحكومية من مختلف أنحاء العالم ينصب نشاطها على تطوير البروتوكولات والمعايير المستخدمة على الشبكة العنكبوتية وقد قامت باطلاق XML فى 1996 وتم اعتمادها نهائياً من قبل الرابطة فى فبراير 1998 الذى كان عام انتشارها على الانترنت .

وكما يشير موقع الرابطة فقد روعى عند تصميم هذه اللغة أن يتم تحقيق عدة أهداف هى :
§ تقنين نشر المصادر الالكترونية بشكل مستقل بأسلوب موحد .
§ سهولة تبادل البيانات خاصة المرتبطة بالتجارة الالكترونية .
§ تسليم المعلومات الى البرامج المحلية المستخدمة من قبل المستفيدين بشكل يسهل من معالجتها آلياً والتعامل معها فور استقبالها واستلامها .
§ سهولة معالجة المعلومات والبيانات وتبادلها عبر مختلف التطبيقات والأنظمة بتكلفة أقل.

سهولة نشر ودعم صياغة توصيفات البيانات Metadata لكل وثيقة مما يسهل استرجاعها واكتشافها ومن ثم ايجاد حلقة اتصال بين منتج او صانع المعلومات والمستفيد النهائى منها.

هذا وتعتبرXML الابن الثانى للغة SGML حيث تعمل كنسخة مصغرة من الأخيرة ولقد أصدرت رابطة الشبكة العنكبوتية اصدارا مصغراً ل XML أطلقت عليها X-Smiles 0.6 و تم اطلاق الاصدار السادس منها فى ابريل 2002 هى خاصة بالمستخدمين المبتدئين حيث تشتمل على أقل عدد ممكن من التيجان وأكثر الامكانات انتشاراً واستخداماً . وعلى عكس سابقتها HTML التى كانت تواجه مشكلات عديدة فيما يتعلق بعدم الإحكام والسيطرة الكافية للتعبير عن البيانات حيث لا تهتم بترتيب الأكواد الخاصة بالبيانات مما يصعب الأمر بالنسبة لبرنامج المتصفح فى استنتاج المعنى المقصود من البيانات وهيكلتها وترتيبها بالشكل المقصود الأمر الذى يجعل من احتمالية تعدد الترجمة وتفسير البيانات من خلال أكثر من متصفح احتمالا قائما بشدة خاصة مع الصفحات المعقدة التى تشتمل على اكثر من شكل للمعلومات جاءت XML لتقضى على هذه المشكلة فهى تهتم بماهية البيانات والهدف منها ولا تترك للبرنامج او المستخدم ان يخمن او يشكل البيانات فهى لغة مقيدة ومحكمة تقوم بذلك بنفسها وتهتم بأدق التفاصيل حيث تتم معالجة البيانات داخلها من خلال برامج XML وتطبيقاتها .

المعايير والتطبيقات

هناك العديد من المعايير التى تتعلق بلغة XML اشهرها معيار ISO 150022 ولقد اصدرت المنظمة الدولية للتوحيد والقياس ISO عدة معايير تهتم بتطبيقات XML المختلفة لعل أهمها :

§ ISO/IEC 8825-4:2002
وهو معيار يهتم بوضع قواعد للتكويد باستخدام XML.

§ ISO/IEC 9075-14:2003
معيار يتعلق بضوابط استخدام لغة الاستعلام المهيكلة SQL ولغة XML فى تطبيقات قواعد البيانات .

§ ISO/TS 10303-28:2003
وهو معيار تطورة اللجنة الخاصة بتطبيقات النظم الآلية فى مجالات الصناعة وهو يتعلق بتمثيل وتبادل البيانات الخاصة بلغة XML.

§ ISO/IEC 13522-8:2001
معيار تكويد النصوص والوسائط الفائقة باستخدام لغة XML

§ ISO/IEC TR 18057:2004
معيار يستخدم فى نظم الاتصالات اللاسلكية وتبادل المعلومات بين النظم المختلفة التى تستخدم تقنية التصفح الصوتى Voice Browsering .

§ ISO/TS 20625:2002
معيار يدعم تبادل البيانات الكترونيا EDI ويركز على قواعد تخليق وصياغة وتبادل الملفات بلغة XML وقامت بتطويره اللجنة الخاصة بتبادل البيانات الكترونيا لاغراض الادارة والتجارة والنقل EDIFACT .

§ ISO/IEC TR 22250-1:2002
معيار يركزعلى التوصيف اللغوى القياسى للغةRegular Language Description for XML RELAX

§ ISO 22643:2003
معيار يركز على قاموس كيانات البيانات المحددة مسبقا والتى يتم توصيفها من خلال تقنية DTD التى تهتم بتوصيف البيانات .

هذا وبعيدا عن معايير الايزو هناك اكثر من 400 مبادرة (3) تجمع بين معايير وتطبيقات وتقنيات خاصة بلغة XML فى مختلف المجالات .

ولغة XML مثلها مثل اى لغة اخرى تستند على مجموعة من الأدوات :

XSL - eXtensible Style Landuage) ) لغة تحديد الأنماط القابلة للامتداد (4) وهى لغة خاصة بتنسيق البيانات بأكثر من شكل وطريقة لتتلائم واحتياجات المستفيدين المختلفة.

(XML Linking Language) X Link لغة تخليق الروابط الفائقة (5) وهى مسئولة عن تخليق الروابط الفائقة وتضمينها داخل الوثيقة بعد تعريفها من خلال لغة التأشير Pointer X .

(XML Pointer Language) X Pointer لغة التأشير (6) وهى تشير الى مكان المصدر او الكائن داخل الوثيقة وكذلك العناصر الأخرى المرتبطة به حيث تعمل كمحدد او معرف معيارى لأى مصدر Uniform Resource Identifier وهى تستند على لغة تحديد المسارXML Path language - X Path.

(XML Path language) X Path لغة تحديد المسار الخاصة (7) وهى تهتم بتحديد مسار او مكان المصدر داخل الوثيقةحيث تعمل بمثابة محدد معيارى لعناوين المصادر Uniform Resource Locator.

وكلا اللغتين مسئول عن توصيف البيانات داخل الوثيقة وتحديدها بالتيجان المناسبة وتحديد مسارها والهدف منها وعمليات المعالجة التى ستتم عليها من خلال تقنية وثيقة تعريف النوع (DTD) Document Type Definition التى يتم من خلالها تحديد موصفات كل عنصر أو مصدر داخل الوثيقة وتوصيفه وتحديد الطريقة التى يتم بها ترتيب تلك العناصر والإجراءات أو المهام التى ستتم على تلك العناصر وأى التطبيقات سيقوم بتلك الاجراءات فهى بمثابة تعليمات وتوجيهات من اجل تيسير تبادل البيانات أو التعامل معها من قبل الأنظمة والتطبيقات المختلفة . وتلك المعايير تخضع حالياً للتطوير من قبل W3C .

(XML Query Language) X Query لغة الاستعلام الخاصة بالبحث واسترجاع المعلومات الخاصة بأى عنصر بيانات او مصدر داخل الوثيقة (8) حيث تستند فى عملها على لغة تحديد المسار X Path ولغة التأشير X Pointer .

والأمر لم يقف عند هذا الحد بل سعت W3C إلى الدفع بين XML و HTML ليعملا معاً فى حاوية أو لغة واحدة .. فأطلقت لغة تحديد النص الفائق القابلة للامتداد (Extensible Hypertext Markup Language) XHTML. لأول مرة فى يناير 2002 والتى أطلق عليها البعض اسم HTML 5.0 .إلا انها أكثر من مجرد إصدار آخر من HTML . ففى أكتوبر 2001 تم إطلاق الإصدار الثانى منها وهدف إلى إعادة تشكيل وتكوين تيجان HTML لتتكامل مع تطبيقات XML حيث ستكون حجر الأساس فى تطوير المعايير التى تدعم نشر والتعامل مع صفحات الانترنت من خلال مختلف برامج المتصفحات Browsers حتى تلك التى تعمل من خلال التليفونات المحمولة والتليفزيونات التفاعلية ونظم الاتصالات اللاسلكية بصفة عامة مما يؤدى إلى تقليل تكاليف كتابة وتخليق النصوص الفائقة مع سهولة أكثر فى التعامل مع قواعد البيانات والتطبيقات المختلفة فضلا عن تكامل HTML مع مختلف تطبيقات XML كما سبق وأشرنا

تطبيقات لغات التحديد فى المكتبات

1 - تصميم مواقع المكتبات على الانترنت

لا شك أن أغلب المكتبات قد استخدمت لغة HTML فى تصميم مواقعها على الإنترنت ولكن يجب على المسئولين عن هذه المواقع النظر للمستقبل خاصة مع ملاحظة السرعة التى تنتشر بها XML وعزوف الكثير من مصمى المواقع عن استخدام HTMLمع وجود العديد من اللغات الاخرى حتى ان البعض يشير الى موت HTML (9) لذا يفضل أن يتم استخدام XHTML بالنسبة لحفظ المصادر الرقمية على المدى البعيد مع استخدام تقنية وثيقة تعريف النوع (DTD) Document Type Definition.

كذلك عند تصميم بوابات “Portals” داخل مواقع المكتبات للربط بينها وبين المكتبات وشبكات المعلومات الأخرى تكون هناك مشكلة فى تبادل البيانات الموزعة والمنتشرة بين أكثر من شبكة معلومات موزعة جغرافيا .

من هنا تلعب XML دوراً هاماً فى تقديم توصيفات البيانات Metadata وغيرها من البيانات بشكل معيارى يسهل تبادله والتعامل معه آلياً من خلال تقنية DTD .

أيضاً تستخدم لغة XML فى تبادل البيانات بين مختلف التطبيقات داخل الشبكات الداخلية للمكتبات Libraries Intranet (10) حيث تسمح بتأمين وإدارة البيانات بمستويات مختلفة داخل تلك الشبكات .

2 - النشر الإلكترونى

استخدمت XML كلغة لنشر الكتب الإلكترونية نفسها من جهة وفى تبادل البيانات بين ناشرى هذه الكتب من جهة أخرى (11) ولقد ساعد هذا ظهور العديد من المعايير التى تنظم هذا الأمر .. مثل :

§ معيار تبادل الكتب الإلكترونية Electronic Book Exchange - EBX

وهو معيار بنى أساسا على لغة XML بهدف تسهيل النشر وتبادل الكتب الالكترونية بين الناشرين والمكتبات والعاملين فى صناعة الكتب الالكترونية بصفة عامة مثل الموزعين والوسطاء .

§ معيار البناء المفتوح لنشر الكتب الإلكترونية The Open E. Book Publication Structure (OEB)

وهو نموذج بيانات لهيكلة نصوص الكتب الإلكترونية ونشرها وتم اطلاقه فى سبتمبر1999 وهو يسمح بقراءتها على مختلف الاجهزة والتطبيقات .

أيضاً قامت شركة Gale Group .. وهى شركة عالمية رائدة فى مجال النشر الإلكترونى ونشر المراجع الإلكترونية لصالح المكتبات والمؤسسات التعليمية . أعلنت مؤخراً عن تطويرها لأداة تسمى ناشر XML المحترف (XPP) XML Professional Publisher تستخدم هذه الاداة فى نشر المواد المرجعية وغيرها بلغة XML و SGML وترجمتها إلى شكل آخر متداول عبر الانترنت مثل PDF وهذه الاداة يمكنها حتى الآن التعامل مع الصفحات ذات التصميم البسيط أما الصفحات المعقدة التى تشتمل على اكثر من نوع مثل الصوت والصورة والنص فلا تجيد التعامل معها فهى تخضع للتطوير الآن ولكنها تتميز بسهولة الاستخدام حيث لا يشترط ان يكون المستخدم على دراية بلغتى XML أو SGML .

3 - بناء وادارة قواعد البيانات البيليوجرافية

لعل أبرز مثال يمكن أن نسوقه هنا هو نموذج المكتبة القومية الطبية الأمريكية NLM فلقد اعتمدت المكتبة (12) فى بناء النظام الخاص بها على لغة XML لتمثيل البيانات وترميز الاستشهادات البليوجرافية المتضمنة فى مرصد بيانات Medline .. وهى تعمل الآن على نقل وترجمة اكثر من 12 مليون تسجيلة ببليوجرافية إلى شكل XML وذلك ليسهل التحكم فى هذه البيانات وادارتها واخراجها فى أكثر من شكل وطريقة لخدمة احتياجات المستفيدين المختلفة كذلك تعمل على اخراج قائمة رؤوس الموضوعات الطبية الخاصة بها MESH فى شكل XML وستطرحها فى الأسواق قريبا من خلال تبنيها لمعيار MARC/XML الذى سيرد الحديث عنه تفصيلا لاحقا ايضا تعتمد على لغة XML فى بنية محرك البحث الخاص بها.

هذا وليست المكتبة القومية الطبية الأمريكية هى التجربة الوحيدة فى هذا المجال بل هناك ايضا مشروع مكتبة لان الطبية بالمركز الطبى لجامعة ستانفورد والمعروف باسم Medlane project والذى بدأ منذ 1998 حيث يتم من خلاله تحويل تسجيلات مارك الى شكل XML والذى نتج عنه مشروع XOBIS (the XML Organic Bibliography Information Schema) .

كذلك نجد رابطة مكتبات واشنطن للبحث The Washington Research Library Consortium حيث تستخدم XML لاتاحة قواعد البيانات والمجموعات الرقمية والمواد المعارة وكذلك بيانات الفهرس الخاص بها من خلال نظام محلى تم تطويره بواسطة المكتبة وهو يسمى ALADIN (Access to Library And Database Information Network) والبرنامج لايقتصر فى خدمته على مكتبات البحث الاكاديمية فقط بل يتعدى ذلك الى القيام بمهام اخرى معقدة مثل قابلية التحقق من هوية المستفيد من خلال تحويل رسائل XML عبر تطبيقات شبكة المكتبات على الانترنت (13) .

أيضاً يمكن استخدام لغة XML وأدواتها فى إنتاج الببليوجرافيات(14) حيث يمكن تحويل البيانات البببليوجرافيةXML لمرة واحدة ثم يعاد استخدامها لاكثر من مرة بأكثر من طريقة وشكل فى أكثر صفحة لأكثر من هدف .. فمثلاً يمكن عمل الببليوجرافية مرة بالمؤلف ثم تحويلها إلى ببلوجرافية بالعنوان أو الموضوع أو بالفترة الزمنية أو حتى بالسلاسل أو الناشر فكل هذا متاح من خلال ما تقدمه XML من أدوات خاصة : XSL لغة تحديد الأنماط القابلة للامتداد التى تسمح بعرض المعلومات بأكثر من طريقة اعتمادا على احتياجات المستفيدين منها وكذلك لغة X Link التى تسمح بعمل قائمة ببليوجرافية بمواقع الانترنت المتخصصة موضوعيا فى موضوع قد يهم المستفيدين .. ومن خلال هذه الأدوات سيمكن صيانة وتحديث قائمة ببليوجرافية واحدة ثم عرضها وترتيبها بأشكال مختلفة آليا وفق احتياجات المستفيدين

4 - الفهرسة وصياغة وتبادل توصيفات البيانات Metadata

( أ ) صياغة وتبادل توصيفات البيانات Metadata

استخدمت تقنيات ومعايير توصيفات البيانات لغة XML .. مثل :

· معيار تبادل المعلومات علىالخط المباشر (15) ONIX)Online Information eXchange

وهو معيار جاء نتيجة جهد قطاع النشر وصناعة الكتب وصمم أساسا بهدف تسهيل تبادل البيانات الكترونيا بين دور النشر المختلفة والمهتمين بصناعة الكتاب والمستفيدين وتدعيم زيادة مبيعات الكتب من خلال إمداد المستفيدين ببيانات كاملة و متكاملة فى محتواها عن كل وعاء قد يتقدم بطلب شراءه حيث يمد المستفيد ببيانات شاملة عن الكتاب وصلت الى 211 عنصر واستخدم هذا المعيار لغة XML فى ترميز هذه العناصر ولقد قامت مكتبة الكونجرس بعمل مقابلة بين هذا المعيار ومعيار MARC من خلال ONIX / MARC مما يسهل من تبادل البيانات الببليوجرافية الكترونياً بين المكتبة وغيرها من المكتبات وبين الناشرين .

· معيار دبلن كور

هو تقنين عام لا يرتبط بمجال موضوعى معين أو نوع مخصص من الأوعية ويتكون من 15 عنصر Data Element لتوصيف البيانات وهذه العناصر تتم صياغتها من خلال معيار RFC 2413 الذى يعد أول معيار متوافق مع Dublin Core وعرف فيما بعد بـ DC 1.0 و RFC هو اختصار لــ Request for Comments وقامت بتطويره IETF ويتم التعبير عن هذه العناصر بكود HTML فى رأس الوعاء Header وبدأ يستخدم منذ 1996 وانتشر فى العديد من الدول المختلفة ولعل سبب انتشاره هو الحاجة الشديدة لمثل هذا المعيار وأهمية توصيفات البيانات مما جعله المرشح الأقوى لتحقيق الأهداف المتعلقة بفهرسة وتوصيف مصادر المعلومات الالكترونية فضلاً عن المميزات الأخرى التى يتمتع بها مثل المرونة والاعتمادية وسهولة هذه الواصفات بحيث يسهل فهمها وتطبيقها من قبل قطاع عريض من المستفيدين و المستخدمين ومنتجو مصادر المعلومات دون الحاجة للتدريب عليها .كذلك يكفل تأمين وإدارة الحقوق المتعلقة بالملكية الفكرية . ويعد كذلك نموذج مستقل يمكن دمجه داخل قطاع عريض من البرمجيات والتطبيقات .

ويمكنه وصف المصدر بدقة وكذلك المصادر الملحقة به أو المرتبطة به .أضف إلى هذا ترجمته إلى أكثر من 25 لغة منها : العربية – الصينية- الألمانية - التشيكية - الدانمركية - الإيطالية - اليابانية - الأسبانية - الفرنسية - اليونانية - الفنلندية - البرتغالية والكورية وغيرها من اللغات الأخرى كل هذا دعى إلى دعمه عالمياً خاصة عندما أصدرت الأيزو ISO المعيار المتوافق معه والمعروف بمعيار ISO 11179 .

كل هذه الأمور جعلت DC مرشحاً قوياً للتطبيق فى مجالات موضوعية مختلفة فضلاً عن اعتماد مشروع نظام الأرشيف المفتوح The Open Archives Initiative System (16) على تقنين DC وهو مشروع للمواد الأرشيفية يهتم كذلك بالمصادر التعليمية وتم إطلاقه فى أكتوبر 1999 بهدف تسهيل تبادل وتفسير وتدفق المواد الأرشيفية الإلكترونية بين مختلف الأنظمة من خلال بروتوكول OAP The Open Archives Protocol باستخدام لغة XMLترميز وتكويد عناصر البيانات. فعلى سبيل المثال يمكن التعبير عن توصيفات البيانات الخاصة بتلك المقالة من خلال تلك الشريحة التى تضم بعض عناصر تقنين دبلن كور DC كالتالى :

<?XML version=”1.0”?>

<dc XMLns=”http://www.cybrarians.info/journal”>

<title>XML: is it convert the future of digital libraries? /</title>

<creator>Heba A.Sattar </creator>

<creator Email>hoba10@ahram0505.net</creator Email >

<type >Article</type >

<contributor> Cybrarians Journals,no.1</ contributor>

<publisher>Cairo :Cybrarians Group</publisher>

<date>2004.</date>

<language>arb</language>

<description>An article about XML and it’s Features, applications and impact on digital libraries.</description>

<subject>markup languages</subject>

<subject>XML,SGML,HTML,XHTML.</subject>

<subject>web applications,standards,</subject>

<subject>web publishing,Ebooks,EDI,z39.50,zeeRex.</subject>

<subject>Metadata,MARC,DC,ONIX,DTD,MODS.</subject>

<format>microsoft word file</format>

</dc>

ومع ظهور العديد من التقنيات والمعايير وظهور الحاجة الى تبادل البيانات بين هذه المعايير والقضاء على مشكلات تفسير البيانات ظهرت أطر ونماذج لهيكلة البيانات تسمح بالمقابلة او الترجمة بين اكثر من معيار فى نموذج واحد من خلال تقنية سمات التطبيق Aplication Profiles (17،18) التى يتم من خلالها صياغة نموذج بيانات حيث يتم ترجمة المعيار المحدد إلى معين او محدد الاسماء namespace الخاص بهذا النموذج ثم التعبير عنه بلغة ترميز مهيكلة مثل XML فهو أشبه بهيكل بيانات يتكون من عناصر بيانات من واحد أو أكثر من محددات الاسماء namespaces تتألف معاً من خلال التطبيق وتعمل بمثابة قاموس او محدد مستقل يحدد لكل عنصر تعريف غير قابل للتكرار حتى يسهل استرجاعه وإدارة توصيفات البيانات بالكامل والأمر نفسه بالنسبة لإطار وصف مصادر المعلومات RDF حيث يسمح بإعادة استخدام الوصف الخاص بتوصيفات البيانات كأساس لوصف توصيفات بيانات أخرى مما يدعم المشاركة بين البيانات (19) وكلاهما يستخدم لغة XML فى ترميز وهيكلة بيانات النموذج مما يسمح بسهولة تبادل البيانات وتفسيرها بين مختلف معايير توصيفات البيانات .

لذا يمكننا القول بأن XMLتقدم هيكلاً مفتوحاً لإستيعاب أنواع توصيفات البيانات المختلفة كذلك يسمح هذا الهيكل أو البناء بتكامل البيانات المهيكلة مع غيرها من البيانات الغير مهيكلة ( نصوص - صور - بريد اكترونى - وسائط متعددة ).

(ب) الفهرسة

وسط عالم من الروابط الفائقة وقواعد بيانات النص الكامل كان التحدى الكبير أمام معيار مارك MARC .. فلقد ظهر قصور فى تعاملها مع المعلومات الهرمية والبحث فى وثائق النص الكامل بكفاءة فضلا عن عدم استطاعتها التعامل بسهولة مع الطبيعة الديناميكية للمصادر الإلكترونية من تعدد النسخ والاصدارات خاصة فى حالة الوسائط المتعددة لذا أطلقت مكتبة الكونجرس إصدارها من MARC / XML لأول مرة فى ديسمبر 1999 و أعلنت عنه نهائيًا فى فبراير 2000 والذى تم بناءه على أساس MARC / SGML الذى كان يخضع للتطوير منذ منتصف التسعينات من القرن الماضى حيث تم التعبير عن مفردات مارك بلغة XML لعمل فهارس مكتوبة بـ XML مما يكفل سهولة تبادل البيانات وارتفاع درجة استدعائها High Recall والقضاء على مشكلة استراتيجية البحث التى تفشل فى اعطاء نتائج فى كثير من الأحيان فضلا عن محاولة إيجاد حل لمشكلة انخفاض معدل التحقيق Low Precision والتى قد ينتج عنها الكثيرمن النتائج الغير مرتبطة بموضوع البحث وتستند هذه المقابلة او الترجمة على تقنية وثيقة تعريف النوع ( MARC DTD (Document Type Definition لكل من البيانات الببليوجرافية والمداخل وقوائم الاستناد مع اعطاء بيان تفصيلى عن كل عنصر بيانات .. فعلى سبيل المثال :

يمكن توصيف اسم المؤلف بأكثر من موصف دون المساس بالاسم نفسه او دون ان تكون هذه الموصفات جزءاً من الاسم وقد تكون هذه الموصفات بيانات ببليوجرافية وقد لا تكون بيانات ببليوجرافية مثل البريد الالكترونى للمؤلف و ذلك باستخدام لغة X Links و لغة X Pointers تلك الأدوات تستند عليها XML فكما سبق واشرنا الى المرونة التى تتمتع بها تلك اللغة حيث تسمح للمستخدم بتخليق التيجان التى يرغب من خلالها فى تمثيل البيانات الخاصة به وفق طبيعة تلك البيانات واحتياجات استرجاعها فعلى سبيل المثال يمكن عمل تسجيلة مبسطة يتم فيها صياغة التيجان وفق بيانات الفهرسة كالتالى :

<marc_record>
<book>
<title>XML for Web publishing in six easy steps</title>
<author>Pfaffenberger, Bryan</author>
<publisher>AP Professional</publisher>
<publication_year>1998</publication_year>
</book>
<subject_heading>Web publishing</subject heading>
</marc_record>



وفيما يلى مثال لتسجيلة ببليوجرافية كاملة لعناصر مارك فى شكل XML



<?XML version="1.0" encoding="UTF-8" ?>

<collection XMLns="http://www.loc.gov/MARC21/slim">

<record>

<leader>01142cam 2200301 a 4500</leader>

<controlfield tag="001">92005291</controlfield>

<controlfield tag="003">DLC</controlfield>

<controlfield tag="005">19930521155141.9</controlfield>

<controlfield tag="008">920219s1993 caua j 000 0 eng</controlfield>

<datafield tag="010" ind1="" ind2="">

<subfield code="a">92005291</subfield>

</datafield>

<datafield tag="020" ind1="" ind2="">

<subfield code="a">0152038655 :</subfield>

<subfield code="c">$15.95</subfield>

</datafield>

<datafield tag="040" ind1="" ind2="">

<subfield code="a">DLC</subfield>

<subfield code="c">DLC</subfield>

<subfield code="d">DLC</subfield>

</datafield>

<datafield tag="042" ind1="" ind2="">

<subfield code="a">lcac</subfield>

</datafield>

<datafield tag="050" ind1="0" ind2="0">

<subfield code="a">PS3537.A618</subfield>

<subfield code="b">A88 1993</subfield>

</datafield>

<datafield tag="082" ind1="0" ind2="0">

<subfield code="a">811/.52</subfield>

<subfield code="2">20</subfield>

</datafield>

<datafield tag="100" ind1="1" ind2="">

<subfield code="a">Sandburg, Carl,</subfield>

<subfield code="d">1878-1967.</subfield>

</datafield>

<datafield tag="245" ind1="1" ind2="0">

<subfield code="a">Arithmetic /</subfield>

<subfield code="c">Carl Sandburg ; illustrated as an anamorphic adventure by Ted Rand.</subfield>

</datafield>

<datafield tag="250" ind1="" ind2="">

<subfield code="a">1st ed.</subfield>

</datafield>

<datafield tag="260" ind1="" ind2="">

<subfield code="a">San Diego :</subfield>

<subfield code="b">Harcourt Brace Jovanovich,</subfield>

<subfield code="c">c1993.</subfield>

</datafield>

<datafield tag="300" ind1="" ind2="">

<subfield code="a">1 v. (unpaged) :</subfield>

<subfield code="b">ill. (some col.) ;</subfield>

<subfield code="c">26 cm.</subfield>

</datafield>

<datafield tag="500" ind1="" ind2="">

<subfield code="a">One Mylar sheet included in pocket.</subfield>

</datafield>

<datafield tag="520" ind1="" ind2="">

<subfield code="a">A poem about numbers and their characteristics. Features anamorphic, or distorted, drawings which can be restored to normal by viewing from a particular angle or by viewing the image's reflection in the provided Mylar cone.</subfield>

</datafield>

<datafield tag="650" ind1="" ind2="0">

<subfield code="a">Arithmetic</subfield>

<subfield code="x">Juvenile poetry.</subfield>

</datafield>

<datafield tag="650" ind1="" ind2="0">

<subfield code="a">Children's poetry, American.</subfield>

</datafield>

<datafield tag="650" ind1="" ind2="1">

<subfield code="a">Arithmetic</subfield>

<subfield code="x">Poetry.</subfield>

</datafield>

<datafield tag="650" ind1="" ind2="1">

<subfield code="a">American poetry.</subfield>

</datafield>

<datafield tag="650" ind1="" ind2="1">

<subfield code="a">Visual perception.</subfield>

</datafield>

<datafield tag="700" ind1="1" ind2="">

<subfield code="a">Rand, Ted,</subfield>

<subfield code="e">ill.</subfield>

</datafield>

</record>

</collection>

فلقد جاء التزاوج بين MARC و XML ليضمن ويكفل سهولة تخليق التسجيلات الببليوجرافية لمرة وحدة ثم عرضها بطرق مختلفة فضلا عن امكانية عرض تلك التسجيلات من خلال التطبيقات المختلفة من متصفحات ومحركات بحث وبصفة خاصة النظم الآلية للمكتبات التى تعمل فى بيئة الانترنت دون الحاجة لبرامج تحويلية كما تكفل سهولة تبادل تلك التسجيلات دون حدوث فاقد فى البيانات اضف الى ذلك انها جاءت لتقضى على المشكلات التى تواجهها مارك(20) فى التعامل مع المصادر الالكترونية مثل مشكلة التعامل مع الحروف الغير لاتينية مثل الهجائية الصينية والروسية وكذلك مشكلات الضبط الاستنادى.

أيضاً الربط بين البيانات الببليوجرافية وغير الببليوجرافية داخل الحقل الواحد لم يكن متوفرا مع MARC فى صورتها المعروفة ولكن هذا الامر يشكل ضرورة هامة بالنسبة للمكتبات الرقمية التىتعتمد على الروابط الفائقة Hyper Links كما أنه يعتبر كود موحد يسهل تبادله وفهمه وتفسيره من قبل كافة التطبيقات حيث كانت هذه مشكلة تواجه مارك وهى انه ليس كل التطبيقات يمكنها ان تدعم بيانات مارك وهذا سيمكن أى مكتبة تعتمد على نظام آلى متكامل من إصدار فهرسها فى شكل XML مما يجعل البحث فيه أكثر سهولة وديناميكية وكفاءة .

ولقد تم تطوير هذه المقابلة او الترجمة MARC / XML بالتعاون بين مكتبة الكونجرس ومركز التحسيب على الخط المباشر OCLC وتم مراجعته من قبل المكتبة الوطنية الكندية والمكتبة القومية الطبية الأمريكية NLM وتتولى مسئولية صيانته مكتبة الكونجرس وهو يسهل كما ذكرنا من تبادل تسجيلات مارك فى بيئة XML وكذلك يسهل من التبادل بين تقنيات ومعايير توصيفات البيانات التى تستخدم XML من خلال كود وصف كيانات توصيفات البيانات: Metadata Object Description Schema (MODS) والذى يعد وسيلة وأداة تستند عليها المقابلة او الترجمة لبناء تسجيلات ببليوجرافية تعتمد فى اساسها على توصيفات البيانات من خلال التعبير النصى بدلا من التيجان الرقمية وتسمح هذه الأداة بالمقابلة والترجمة بين مارك وبين تقنيات توصيفات البيانات الأخرى. ولقد تم استخدام المقابلة بين MARC / XML فى مشروع نظام الأرشيف المفتوح The Open Archives Initiative

وإذا نظرنا إلى البناء الهيكلى لمعيار MARC XML Architecture نجده يتكون من : -

1 - نموذج البيانات المهيكل أو تيجان المقابلة وهى خاصة بعمل ترجمة ومقابلة بين معيار MARC / XML وتقنينات توصيفات البيانات الأخرى .

2 - تيجان التمثيل أو الترميز وهى التى يتم من خلالها ترميز بيانات مارك إلى شكل مقروء آليا باستخدام XML

3 - عمليات المعالجة وهىتلك التى تتم على بيانات مارك لإخراج نتائج تحليلية خاصة بتطوير ومعالجة البيانات مثل برامج وعمليات التحقق Validation .

4 – تسجيلات ( Metadata Object Description Schema (MODS .

5 - تسجيلات DC .

6 - أشكال XML الأخرى ( تقنينات توصيفات البيانات الأخرى ) .

7 - أداة لصياغة المخرجات فى شكل HTML .

8 - MARC DTD أو تقنية وثيقة تعريف النوع المتضمنة فى مارك وهو يقوم بتعريف وتوصيف كل كيان وعنصر بيانات وتحديد الموصفات اللازمة له والعلاقات بين الكيانات وعناصر البيانات وفق التدرج المنطقى لبناءها داخل المحتوى من خلال قيم ومحددات لهذه الموصفات سواء كانت محددة أو قابلة للتكرار مما يؤدى إلى إحكام مستوى الدقة على المحتوى من خلال أداة تعمل بمثابة قاموس بيانات يشتمل على الموصفات والمحددات أو المؤشرات التى تشير إليها .

ولقد كفل هذا البناء المحكم للمعيار إمكانية إجراء مستويات مختلفة من التحقق Validation (21) من خلال برنامج معد لذلك ولكنه خارج نموذج البيانات للمعيار نفسه وهذا التحقق يتم على ثلاث مستويات :

1 - التحقق من كود XML وفق معيار MARC / XML .

2 - التحقق من تيجان MARC21 ( الحقول والحقول الفرعية ) .

3 - التحقق من محتويات تسجيلات مارك ويشمل ذلك القيم المكودة والبيانات .. الخ .

كل هذا يكفل بناء محكم ومرن يسهل تبادل بيانات مارك وكذلك توصيفات البيانات داخل نموذج بيانات واحد فى نفس الوقت.

5. تبادل البيانات إلكترونيا ًEDI

يعرف تبادل البيانات إلكترونياً EDI - Electronic Data Interchange بأنه عملية تبادل لبيانات مهيكلة وفقاً لمعايير متفق علها مسبقاً محددة سلفاً بين جهازين أو نظامين ألين هما المستقبل والمرسل وذلك عبر وسيط الكترونى دون تدخل بشرى . وأغلب مستخدمى هذه التقنية يعانون من مشكلات تتعلق بتعقد المعايير الخاصة بـ EDI ومشكلة تكاملها مع البرامج المحلية التى يستخدمونها على أجهزتهم وهذا يرجع إلى أن الرسائل التى يتم تبادلها عبر هذه المعايير تعتمد على وجود نموذج للبيانات ويتم ترجمة البيانات إلى المعيار المستخدم من خلال هذا النموذج (22) ويمكن إجمال مشكلات المعايير الحالية (23) كالتالى :

1- غالباً ما تكون بنية الرسالة لا تدعم احتياجات المستفيدين المتعلقة بالمعالجة الآلية وإمكانية التعامل معها بالبرامج المحلية حيث لا يتم الاهتمام بسبل المعالجة الممكنة المرتبطة بطبيعة عمل المؤسسة وطبيعة أنواع وأشكال المعالجة التى تحتاجها عن البيانات مما ينتج عنه فى كثير من الحيان سوء فهم لهذه البيانات نظراً لتعقدها .

2- تقوم كل مؤسسة بعمل دليل للاستخدام خاص بأنماط المعالجة التى تتم على الرسالة المتبادلة ونظراً لكثرة المؤسسات التى تعمل فى مجال واحد تتعدد أدلة الاستخدام للرسالة الواحدة أضف إلى ذلك أن بنية المعيار نفسه تتكون من عدد من الإجراءات الفرعية سواء ما يطبق منها على المستوى الوطنى أو المحلى داخل المؤسسات وتسمح باختيار المستوى المطلوب لكل هذه الإجراءات لكنها لا تحدد الشروط التى يجب تحقيقها ومتطلبات استخدام او القيام بكل إجراء لذا فإن نفس المعلومات يمكن أن يتم التعبير عنها بشكل مختلف داخل الرسالة الواحدة ومن ثم يصعب فى النهاية إيجاد ترجمة مقننة من قبل البرامج المسئولة عن ذلك .

ويمكن القضاء على هذه المشكلات من خلال استخدام نموذج توصيفات البيانات Metadata Model وترجمته أو مقابلته بنموذج البيانات المستخدم داخل كل معيار حيث تقوم توصيفات البيانات بتعريف وتحديد فهرس الرسالة أو مسارها Directory ثم توصيف الإجراءات الفرعية داخل الرسالة وعناصر البيانات المرتبطة بها ثم مسار كل عنصر وقائمة الأكواد المستخدمة للتعبير عن كل عنصر بيانات ثم توصيف قيمة كل كود ثم توصيف العلاقات بين عناصر البيانات المختلفة وتحديد طبيعة المعالجة التى يمكن أن تتم على كل عنصر بيانات

وشكل Format توصيفات البيانات هام جداً لبرنامج الترجمة وحتى الآن من الناحية التجارية برامج الترجمة ليست قادرة على التعامل مع نماذج توصيفات البيانات بشكل جيد أو ترجمتها إلى الشكل المحلى المقروء من قبل تطبيقات المستخدم ولكنها فى تطور مطرد ومتلاحق يومياً لذا من المتوقع أن تكون قادرة على ذلك فى المستقبل القريب .

إلا أن فكرة استخدام توصيفات البيانات تقدم نموذج بيانات معيارى موحد يسستخدم لتوصيف الرسائل المتبادلة الكترونياً من خلال لغة XML / EDI مما يحل المشكلات المرتبطة بمعايير تبادل البيانات الكترونياً ويدعم هذا الامر المعيارية والإحكام والمرونة التى تتمتع بها XML .

6. Z39.50 المشكلة و ZeeRex الحل

مما لا شك فيه ان بروتوكول Z39.50 ادى الى حل العديد من المشكلات فيما يتعلق بالبحث فى قواعد البيانات الموزعة والمنتشرة جغرافيا الا انه جلب معه مشكلات اخرى دفعت باللجنة الدولية لصيانته Z39.50 International Maintenance Agency باصدار الجيل الثانى من البروتوكول الدولى الذى عرف باسم "زنج" او ZING, "Z39.50-International: Next Generation وهى سلسلة من المعايير والبروتوكولات تهدف الى القضاء على المشكلات المتعلقة بالوصول للمعلومات واتاحتها وجعل Z39.50 اكثر جذبا للموردين والمطورين ووكلاء النظم والمستخدمين



مقالة اخرى
http://www.aysoal.com/boltkan/index....art&itemid=516

تساءلت عن إمكانية إيجاد نظام يمكننا من رسم الصور وملفات الفيديو من خلال رموز شبيهة برموز لغة تصميم المواقع ال HTML وتساءلت عن إمكانية أن يكون أحد الساميين المبادر بهذا الأمر.لكن يبدو أنه لا عزاء لساميي العرق، فأبناء العم سام سبقوهم ليس فقط بالتفكير في الأمر بل وبالشروع فيه أيضا. W3 Consortium وهي المجموعة التي ساهمت في تطوير ال HTML قامت أيضا بابتكار لغة الXML وهي لغة تستخدم في وصف المستندات لكن الجديد أنها أيضا قامت بتطوير طرق لرسم الصور وتحسين أداء ملفات الصوت والفيديو أيضا من خلال لغة ال XML. تميز لغة ال XML بأنها ليست بديلا عن لغة ال HTML بل مكملة لها كونها تمد الصفحات بخصائص وصفية يحددها المصمم بعكس ال HTML حيث الوسوم محددة آنفا ومحدودة. وبالتالي فإن ال XML تحل مشكلة كبيرة في عالم الإنترنت وهى فوضى المواد المنشورة لأن أحد ما توّفره للمهتمين بالنشر الإلكتروني هي إمكانية وصف مستنداتهم بطريقة MARC التي تعتمدها المكتبات في فهارسها الإلكترونية وهذا يعني أن صفحات الإنترنت التي تصف نفسها بواسطة ال XML يمكن فهرستها كجزء من مقتنيات المكتبة موسعين نطاق ما يحصل عليه المستخدم وفاتحين آفاق أكبر لأخذ المنشورات الإلكترونية على محمل الجد. حريّ بالذكر أن لغة ال WAP المستعملة في مجال الهواتف النقالة هي من نسل ال XML. ما يهمنا هنا هو أن إتحاد W3 أوجد لغة تسمى SVG وهي اختصار ل Scalable Vector Graphics أوالرسوم المتصلة القابلة لتغيير القياس والتي تتيح إنشاء أشكال وصور ثنائية الأبعاد من خلال كتابة أوامر نصية متوافقة مع ال XML مما يعني حجما أصغر بكثير للملفات. في عالم الرسوميات هنالك التقنية القديمة المسماة ب Raster أو التقنية النقطية والتي نجدها في معظم الصور المحفوظة بنسق GIF أو JPG حيث يتم تقسيم الصورة على شكل نقط، وهنالك التقنية الأحدث وهي تقنية ال Vector التي تأتي شكل شبيه بالمعادلة. مميزات طريقة ال Vector أن الصورة يمكن تكبيرها أو تصغيرها دون أن يتأثر حجم ملفها فضلا طبعا عن التوفر في حجم الصورة الأصلي الناتج عن كون الملف عبارة عن معادلة لا رسما مقسما لمجموعة من النقاط كما هو الحال مع التقنية الأولى. الجميل في تقنية SVG أنها تمكن من إنشاء أشكال ديناميكية متحركة كما أن الرسومات التي تحتوى على نصوص يمكن أن تدرج محركات البحث! أحد المنتجات القريبة لإتحاد W3 كان الـSMIL وهي لغة تمكن من إنشاء ملفات الفيديو وإن كانت رموز الXML تستخدم هنا في تعزيز فاعلية ملف الفيديو المعروض ومنحه خصائص إضافية وليس كتابته من الصفر. علي أعترف بخيبة الأمل على اقتراحي المهدر الذي لم يتسن لأحد من أبناء جلدتي العمل عليه، لكن هذا يعلمنا جميعا درسا هاما؛ فقد قلت الأسبوع الفائت أننا ما عدنا في عالم من يملك ومن لا يملك بل في عالم من يسرع ومن لا يسرع، لكن إذا لم نكن من ذوي الصفوف المتقدمة فالإسراع وحده لا يكفي، ولا شئ أقل من مضاعفة السرعة ومضاعفة الجهود ومضاعفة الآمال سيجدي وإلا سنسقط غير مأسوف علينا
http://www.aysoal.com/boltkan/index....art&itemid=516












التوقيع
*لا إله إلا أنت سبحانك إني كنت من الظالمين*

كن كالنخيل عن الأحقاد مرتفع ،،، بالطوب يرمى فيقذف أطيب الثمر

http://arablibrariannet.blogspot.com/
  رد مع اقتباس
قديم Sep-14-2006, 08:49 AM   المشاركة8
المعلومات

AHMED ADEL
مكتبي متميز

AHMED ADEL غير متواجد حالياً
البيانات
 
العضوية: 18689
تاريخ التسجيل: Aug 2006
الدولة: الإمارات
المشاركات: 249
بمعدل : 0.04 يومياً


قلم اتمنى

تجميع كل مايخص الموضوع في ملف واحد لتحقيق استفادة اكبر للباحثين












التوقيع
*لا إله إلا أنت سبحانك إني كنت من الظالمين*

كن كالنخيل عن الأحقاد مرتفع ،،، بالطوب يرمى فيقذف أطيب الثمر

http://arablibrariannet.blogspot.com/
  رد مع اقتباس
قديم Sep-14-2006, 10:54 AM   المشاركة9
المعلومات

maroadil
مكتبي جديد

maroadil غير متواجد حالياً
البيانات
 
العضوية: 18822
تاريخ التسجيل: Aug 2006
الدولة: مصـــر
المشاركات: 10
بمعدل : 0.00 يومياً


منوّع انطلق

انطلق صاروخ تقنية المعلومات
انتبهوا
مهما أثنيت عليك أيها الزميل لن أعطيك حقك
فلك الفضل فى إتاحة هذه المقالات الرائعة
التى أتمنى أن تتاح للمكتبيين من خلال ورش العمل
لنكون فى الطريق إلى مواكبة التطورات التقنية
على الصعيد العملى انتبهوا
شكر جزيل للزميل المجاهد أحمد عادل












  رد مع اقتباس
قديم Apr-15-2008, 05:48 AM   المشاركة10
المعلومات

روعة الباز
مكتبي جديد

روعة الباز غير متواجد حالياً
البيانات
 
العضوية: 45955
تاريخ التسجيل: Mar 2008
الدولة: السعـوديّة
المشاركات: 11
بمعدل : 0.00 يومياً


افتراضي

جزاك الله خير من جد كنت محتاجة هادي المعلومات لبحث في الجامعة












  رد مع اقتباس
قديم Apr-15-2008, 05:59 PM   المشاركة11
المعلومات

وصال المجد
مشرفة منتديات اليسير
أروى حلواني

وصال المجد غير متواجد حالياً
البيانات
 
العضوية: 7440
تاريخ التسجيل: May 2004
الدولة: السعـوديّة
المشاركات: 458
بمعدل : 0.06 يومياً


افتراضي ملف متكامل

الأخ الفاضل أحمد عادل
تلبية لأمنيتك وحتى تجتمع جميع الموضوعات التي تناقش XML في موضوع واحد تم دمج الموضوعات
أشكركم على هذه الإضافة القيمة وأشكر جميع من ساهم لإثراء هذا الموضوع
وفق الله الجميع لكل خير












التوقيع
المجد الباسم لا يكون إلا بأيدي الأقوياء
  رد مع اقتباس
إضافة رد

مواقع النشر (المفضلة)


الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 
أدوات الموضوع
انواع عرض الموضوع تقييم هذا الموضوع
تقييم هذا الموضوع:

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة

الانتقال السريع


الساعة الآن 09:06 PM.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. جميع الحقوق محفوظة لـ : منتديات اليسير للمكتبات وتقنية المعلومات
المشاركات والردود تُعبر فقط عن رأي كتّابها
توثيق المعلومة ونسبتها إلى مصدرها أمر ضروري لحفظ حقوق الآخرين