عرض مشاركة واحدة
قديم Feb-27-2004, 08:46 PM   المشاركة4
المعلومات

حسن علية
مكتبي فعّال

حسن علية غير متواجد حالياً
البيانات
 
العضوية: 377
تاريخ التسجيل: Aug 2002
الدولة: السعـوديّة
المشاركات: 111
بمعدل : 0.01 يومياً


افتراضي XML لغة المستقبل للبيئة الرقمية لماذا ؟

رواد اليسير الأحباء
السلام عليكم ورحمة الله
هذا مقال مفصل حول لغة التأشير XML الذي أرجو أن يكون مفيدا للجميع لقد حاولت أن أرفق نسخة كملف مرفق لكن تعذر ذلك لذا فأرجوا المعذرة إذا إختفت بعض الأشكال التوضيحية
أتمنى لكم قرائة ممتعة XML لغة المستقبل للبيئة الرقمية لماذا ؟
التخطيط :
1 المقدمة
2اللغة المؤشرة للنص الفائق
HTML 2.1 لمحة تاريخية و التعريف
2.2 تركيبة وثيقة
HTML 2.3 نقاط قوة
HTML 2.4 نقاط ضعف
HTML 2.5 الخلاصة
3 اللغة المقننة لتأشير المعمم
SGML 3.1 لمحة تاريخية
3.2 الهدف
3.3 وثيقة SGML3.4 مثال تطبيقي
3.5 الخلاصة
4 اللغة التأشير الموسعة
XML4.1 لمحة تاريخية والتعريف
4.2 الأهداف
4.3 الفــــروق بين XML وSGML
4.4 أمثلــــــة
4.5 XML تنوع ا لروابط التشعبية
4.6 مفهوم المصدر العالمي للأسماء
Universal Ressource Name ) 4.7 برامج معلوماتية تخص XML 5
تجـــارب و تطبيقـــــات XML
6 الخلاصة
7 المصادر 1

المــــــقـــــدمــــــــــة :
إن إنتقال الإنتاج الفكري البشري من الوعاء الورقي إلي الوعاء الرقمي أتاح العديد من الإمكانيات في مجال التعامل مع الوثائق التي لم تكن متاحة في السابق وخاصة ظهور مفهوم النص الفائق الذي أحدث تغيرا جذريا في تصورنا لمعنى الوثيقة التي بقية لمدة طويلة لا تعدو أن تكون سوى صفحات متتالية مكتوبة من طرف شخص أو مجموعة أشخاص أو هيئة و لا يمكن الإطلاع عليها إلا بطريقة خطية أي بمعنى الإطلاع مثلا على الصفحة 1 , 2, 3, .... وهو أسلوب متوافق جدا مع تقنية الطباعة على الورق بينما ما يتوفر داخل البيئة الرقمية من خلال النص الفائق يإستعمال الروابط التشعبية يتجاوز كثيرا ما كان معروفا لدينا فالقارئ الآن لديه حرية الإطلاع على الوثيقة بالطريقة التي تتلائم مع حاجته الحقيقية للمعلومات من خلال إبحاره مستعملا الروابط المختارة وبهذا فكل قارئ يصوغ وثيقة تتوافق مع حاجته وليس كما يريد الكاتب وبتوازي مع كل هذا الثراء فإن تركيبة البيئة الرقمية إزدادت تعقيدا وهشاشة فكما كان ظهور الإنترنت للعموم سريعا فقد كان ظهور الواب ولغة برمجتهHTML مفاجئا وكاسحا وسارع كل مستعملي الشبكة وصانعي البرمجيات لاحتضان هذه اللغة التي لا تعدو أن تكون في أساسها سوى حل فردي لمشكلة تبادل الوثائق بمعزل على أجهزة الحواسيب و الأنظمة المشغلة لها فهي ليست إلا إمكانية من بين عدد غير منتهي من الإمكانيات التي يتيحها SGML وكما كانت سرعة الإنتشار فقد كانت سرعة ظهور المشاكل ومحدودية إمكانيات هذه اللغة مما إستوجب مراجعة لغة النشر على الواب .و إننا من خلال هذا المقال سوف نحاول أن نقدم بسطة على اللغات التوصيفية أو لغات التأشير إنطلاقا من HTML ورجوعا إلى الأصل SGML و تقديم الحل المقترح و هو XML .2 اللغة المؤشرة للنص الفائق.

HTML 2.1 لمحة تاريخية و التعريف
لقد كان ظهور HTML نتيجة لأبحاث Tim Berners-Lee سنة 1989 و قد شهد العديد من التحديثات ففي سنة 1994 تم إصدار HTML-2 والذي يحتوي على 37 معلم و في سنة 1996 تم إصدار HTML-3 وفي سنة 1998 تم إصدار HTML-4.
إن HTML هي لغة مهيكلة لتوصيف البيانات فهي تمكننا من توصيف مختلف أجزاء الوثيقة على شكل نص بحت وهي لا تهتم بالشكل النهائي للوثيقة و لا بطريقة الطباعة و تكل ذلك للمبحر فشكل نفس الوثيقة قد يختلف من مبحر إلى آخر. 2.2 تركيبة وثيقة HTML : تتكون وثيقة HTML من جزئين وهي محدة بالمعلمين <HTML > < /HTML> :أ - الرأس ( head) و هو محدد بالمعلمين التاليين < head ></head > و يحتوي هذا الجزء على المعطيات العامة التي تخص الوثيقة(METADATA ) مثل تاريخ الإنشاء, المؤلف و الكلمات المفتاحية وهو ما نستطيع مقارنته بالتسجيلة الببليوغرافية و نجد العديد من البرامج المعلوماتية التي تمكن المرور من MEDATA إلى MARC.ب- الجسم ( BODY) وهو محدد بالمعلمين < BODY> </BODY> و يحتوي على نص المؤلف ويتكون من فقرات و عناوين محددة بمعالم و روابط بإتجاه مواقع أخرى 2.3 مثال لوثيقة HTML :<HTML><HEAD><TITLE>المحاولة الأولى </TITLE> <AUTHOR>حسن علية </AUTHOR> </HEAD><BODY><UL ><H1 >المنظمة العربية لتربية و الثقافة و العلوم </H1 ><H2 >النشأة </H2 >

لقد تم إنشاء المنظمة ................................ </P >..</UL ></BODY> </HTML> 2.3 نقاط قوة HTML :HTML - هو اللغة المعتمدة في الواب HTML - يمكن من إنشاء النصوص الفائقة من خلال الروابط التشعبية -تنوع وكثرة الأدوات التي تمكن من إنشاء و ثائق HTML حتى أصبح من لا يعرف أي معطى عن هذه اللغة -بإمكانه أن ينشأ وثائق HTML عن طريق إحدى برامج تحرير النصوص مثل word-office -إن الأوسام المستعملة داخل هذه اللغة محددة مسبقا مما يجعلها لغة سهلة الإستعمال وهذا أحد أسباب شيوع إستخدامها.2.4 نقاط ضعف HTML : إن توصيف الوثيقة بإستعمال HTML يمكن من هيكلة سيئة للوثيقة بحيث تختلط البنية المنطقية مع البنية الشكلية للوثيقة فمثلا فالواسم
يعني الرجوع إلى السطر وهذا يدخل في إعداد شكل النص. أما الواسم <title > < /title > يعني أن النص الموجود بين الواسمين هو عنوان وهي وحدة منطقية. إن الأوسمة لا تحتوي على أي معطى بالنسبة لمحتوى وثيقة معينة فنفس الأوسام تستعمل لكل أصناف الوثائق مما يجعل مستحيلا إستعمالها أثناء عملية البحث و محاولة لإثراء المعطيات حول محتوى وثائق HTML . تمت إضافة ما يعرف ب المعالم (META DATA ) أثناء مؤتمر DUBLING CORE لسنة 1998 - غياب مفهوم الوثيقة الجزئية ( sub-document) وهذا معطى مهما جدا خاصة بالنسبة للباحث الذي يعلم ما يريد وليس لديه و قت للإطلاع على كامل الوثيقة فنأخذ على سبيل المثال طبيب يريد التأكد من أعراض مرض ما لإتمام عملية تشخيص وهو ليس بحاجة لطريقة العلاج فالآن لا يمكننا أن نوفي بحاجة هذا المستفيد فكل ما يمكن أن نقدمه له هو وثيقة تحتوي على هذه المعلومة و قد يجد حاجته في الصفحة العاشرة وهذا لانتفاء مفهوم الوثيقة الجزئية .- غياب التنوع بالنسبة للروابط التشعبية المستعملة فالنوع الوحيد الممكن هو الرابط الثابت أحادي الطرفين الذي يربط وثيقتين في إتجاه واحد مما إنجر عنه سرعة نهاية صلوحية هذه الروابط نظرا للتغيير المستمر لعناوين المواقع على الواب.2.5 الخلاصة :إذا فنظرا لكل هذه النقائص فقد أحدثت مؤسسة w3c لجنة عمل أثمرت أعمالها إصدار XML و المنادات ببمواصلة العمل لجعله لغة بديلة على الواب. فما هي العلاقة بين HTML و XML ؟ إن هاتين اللغتين تنحدران من لغة أم واحدة و هي اللغة المقننة لتأشير (التوسيم) المعمم SGML (Standard Generalized Marcup language)فما هي هذه اللغة ولماذا لم تستعمل مباشرة بل استعملت لغات منحدرة منها ؟3 اللغة المقننة لتأشـــــير المعمـــــم SGML (Standard Generalized Marcup language)3.1 لمحة تاريخية لقد كان ظهور SGML سنة 1986 حيث تتوجت أعمال العديد من فرق البحث في موضوع لغة تأشير عالمية بإصدار SGML من طرف المنظمة الدولية للتقنين ISO (Inernational Standersation Organisation ) تحت عدد 8879 3.2 الهدف صياغة أنموذج بنية منطقية لتوصيف المعلومات توصيف المعلومات حسب هذا الأنموذجضمان إسمرارية صلوحية إستعمال المعلومات ضمان إستقلالية المعلومات عن الحواسيب و البرمجيات المستعملة 3.3 وثيقة SGML إن ما يسمى بوثيقة SGML هو البرنامج SGML لوثيقة ما و التي يمكن أن نقدمها بطريقة مجردة كما يلي :<!SGML>النص و الأوسام (المعالم)</SGML>وهي تتكون من ثلات أجزاء :3.3.1 التعريفات : وهي تتضمن تعريف ما يلي - شفرة المحارف المستعملة ( ASCI ,UNICODE, ….) - أبجدية اللغة و التي من خلالها نحدد بطريقة مجردة القواعد SGML مثلا في هذا المستوى يمكننا أن نحدد مغلقات و مفتحات الأوسام فمثلا تعودنا أن نرى الوسم ما بين العلامتين <> لكننا نستطيع أن نختار أي علامتين أخريين مثل {} ونفس الأمر بالنسبة لعلامة غلق الوسم المعروفة ب / و التي يمكن إستبدالها مثلا ب * و بذلك تصبح الأوسمة بهذا الشكل {title}…{*title} بدلا من <title> ... </title> بل يمكننا من خلال SGML أن نعرف أوسمة باللغة العربية مثل >عنوان< > , مقدمة < و لكنني لم أقف على أي تجربة عربية في هذا الإتجاه 3.3.2 الأنـــــمـــــوذج: إننا من خلال الأنموذج نقوم بتحديد البنية المنطقية لوثيقة ما و هو يكون قارا بالنسبة لصنف محدد من الوثائق فيمكن مثلا أن ننشأ أنموذجا خاصا بالرسائل نطبقه كلما أردنا أن نكتب رسالة و يمكن حفظه خارج وثيقة SGML وهو يتكون من: 3.3.2.1 إتفاقيات الكتابة : الروابط و مرتبة , و غير مرتبة &أو ׀مؤشرات الإستعمال :مرة واحدة أو أكثر +لا مرة أو مرة واحدة ?لا مرة , مرة واحدة أو العديد من المرات *{...} يرمز إلى مجموعة من الرموز 3.3.2,2 تعريف نوع الوثيقة DTD Document Type Definition : إن DTD هو عبارة عن مجموعة من القواعد و التعاريف التي تمكننا من توصيف صنف معين من الوثائق و يكون بهذا الشكل : < !DOCTYPE , عنوان dtd , مؤشر خارجي ؟, { ] , { تحديد المجموعات الضمنية }+, [ }؟ ,> تحديد المجموعات الضمنية يحتوي على : تحديد العناصر أو تحديد الخاصيات أو تحديد الوحدات مثال رقم 1 : < !DOCTYPE رسالة ] { توصيف مكونات الرسالة } [ >مثال رقم 2 : إستعمال dtd خارجي : < !DOCTYPE , رسالة SYSTEM رسالة. Dtd > 3.3.2.2.1 عــــــنـــــصــــر SGML: يتم الإعلان عن عنصر SGML داخل الأنموذج حسب الصيغة التالية : < ELEMENT ! , إسم العنصر , التصغيرات , نوعية المحتوى> تحليل مكونات العنصر : أ ) إسم العنصر وهو يمكن أن يكون : إسما أو إسما مركبا أو عددا أو عددا مركبا و حسب النشرة الأولى لSGML فيجب أن لايتجاوز عدد الحروف فيه 8 ب) التصغيرات وهي تخص الأوسام :- - : وسم البداية و وسم النهاية إجباريان 00: وسم البداية و وسم النهاية اختياريان- 0 : وسم البداية إجباري 0 - : وسم النهاية إجباري فيما يلي سوف نقدم أمثلة لتوضيح مفهوم التصغيرات فعلى سبيل المثال لنأخذ كاتب أقوم المسالك في معرفة أحوال الممالك لخير الدين التونسي فإذا كان الوسمين إجباريان فسنحصل على:>عنوان< أقوم المسالك في معرفة أحوال الممالك >/عنوان< >مؤلف<خير الدين التونسي >/مؤلف<أما إذا كان الوسمين إختياريان فسنحصل على : أقوم المسالك في معرفة أحوال الممالك , خير الدين التونسي أما إذا كان وسم البداية إجباري فسنحصل على :>عنوان< أقوم المسالك في معرفة أحوال الممالك>مؤلف<خير الدين التونسيأما إذا كان وسم النهاية إجباري فسنحصل على :أقوم المسالك في معرفة أحوال الممالك >/عنوان< خير الدين التونسي >/مؤلف<ت) تركيبة المحتوى : وهو تحديد لنوعية البينات المدرجة بين واسمي العنصر و يمكن أن يكون محتوى معلن أو محتوى مركبا أو محتوى مختلط وفي ما يلي سوف نستعرض بالتفصيل مختلف هذه الأنواع :ü المحتوى المعلن و الذي يستطيع أن يأخذ إحدى هذه القيم التالية : #EMPTY : عنصر فارغ ( معلم البداية إجباري) CDATA # : نص فقط وسم النهاية إجباري # RCDATA: نص قابل لتعويض PCDATA #: نص SGML يمكن أن يحتوي أوسمة مختلفة # ANY: نفس مكونات PCDATA مهما كان العنصر مثال : < !ELEMENT جملة - 0 CDATA # > < !ELEMENT عنوان - 0 CDATA # > < !ELEMENT ملاحظات - 0 ANY # > ü المحتوى المركب : وهو محتو ى يقوم بإستعمال عناصر معلنة أو عناصر معلنة و مركبة ,{ إسم العنصر , مؤشر مرات الإستعمال}* ׀ {محتوى مركب, مؤشر مرات الإستعمال}* ,)مثال : < !ELEMENT فقرة - - ( جملة +) >< !ELEMENT نص - - عنوان , ملاحظات +, فقرة+ > ü المحتوى المختلط : يمكن أن يكون المحتوى في آن واحد معلن و مركب : < !ELEMENT فقرة - - ( PCDATA ׀ عنوان , فقرة+) > 3.3.2.2.2 خــاصــية SGML : إن العنصر SGML يمكن أن تكون له خاصية إجبارية أو إختيارية مثال : < فقرة STATUT = خاص > السيد علي ..... </ فقرة> إذا فهذه الفقرة لن تكون ظاهرة إلا لبعض الأشخاصونعلن على الخاصية بإستعمال الصيغة التالية < !ATTLIST , العنصر , إسم الخاصية ,( نوع الخاصية ׀ قيمة الخاصية ) , القيمة الضمنية ؟ >و فيما يلي سوف نجرد :1- أنواع الخاصيات الممكن أن تلحق بعنصر ما :< !ATTLIST , العنصر , إسم الخاصية ,( نوع الخاصية ׀ قيمة الخاصية ) , القيمة الضمنية ؟ >مجموعة حروف CDATAإسم وحدة ENTITYقائمة أسماء الوحدات ENTITIESمعرف SGML ID إحالة على معرف IDREFإحالة على معرفات IDREFSإسم NAMEأسماء NAMESوحدة لفضية إسمية NMTOKENقائمة وحدات لفضية إسمية NMTOKENSإسم الملاحظة NOTATIONرقم NUMBERأرقام NUMBERSوحدة لفضية رقمية NUTOKENقائمة و حدات لفظية رقمية NUTOKENS2- القيمة الضمنية : < !ATTLIST , العنصر , إسم الخاصية ,( نوع الخاصية ׀ قيمة الخاصية ) , القيمة الضمنية ؟ >الخاصية لها قيمة واحدة ثابتة #FIXEDلأبد من وجود #REQUIREDالقيمة الأكثر حداثة #CURRENT #CONREFإذا لم تعطى قيمة فإن النظام يجب أن يعطي واحدة #IMPLIED3.3.2.2.3 وحدات SGML : وحدات SGML هي مجموعة من الحروف و الأرقام التي يمكن أن تستعمل كمكون واحد وهي تنقسم إلى:1- الوحدات العامة الوحدات العامة تمكن من تعويظ جملة تظهر في أكثر من مكان داخل الوثيقة بدون اللجوء للبحث عنها و تغييرها داخل الوثيقة والتي يتم الإعلان عنها داخل DTD كما يلي : < !ENTITY , إسم الوحدة , محتوى الوحدة > مثال : < !ENTITY , سج, سلسلة جبال الأطلس> و تستعمل داخل النص الموصف بهذا الشكل : <فقرة> إن &سج تمتد من المحيط الأطلسي غربا إلى البحر المتوسط شرقا و يبلغ إرتفاع أعلى قمة .....</فقرة> و تظهر في النص النهائي على هذا الشكل : إن سلسلة جبال الأطلس تمتد من المحيط الأطلسي غربا إلى البحر المتوسط شرقا و يبلغ إرتفاع أعلى قمة ..... ومحتوى الوحدات العامة يمكن أن يأخذ العديد من الأشكال :أ) محتوى نصي وهي الحالة الأكثر شيوعا ب) تحديد و حدة محلية خارجية محتوى = SYSTEM , مؤشر النظام < !ENTITY , رسم SYSTEM "رسم.gif c:image "ت) تحديد وحدة عمومية محتوى = PUBLIC , مؤشر عمومي , مؤشر النظام ث ) المحتوى : بيانات محتوى = SYSTEM , مؤشر النظام , نوع , تدوين نوع : ü CDATA (Character DATA ) : محتوى التعويض نص (… TEX,POSTSCRIPT) والذي سوف يستعمل من خلال محلل خاص خارجي عن النظام ü SDATA ( Specific DATA ) : محتوى التعويض نص سوف يستعمل من خلال محلل داخل النظام ü NDATA ( Non sgml DATA ) : محتوى ليس نصا ( Bitmap, *.exe,... )تدوين : تبين كيف سيتم إستغلال البيانات ث) المحتوى تعليمات محتوى = PI , أوامر خاصة هذه الأوامر يقع تجاهلها داخل sgml و تقع معالجتها من خلال برنامج مستقل مثل word وهذه الأوامر ليست أساسية و لكنها مفيدة جدا لإعطاء الشكل النهائي للنص2- الوحدات الحرفية : هذه الوحدات تمكن من الرجوع إلى أي حرف خاصة الحروف الغير قابلة للطباعة و التي لا توجد على المزرة يتم الإعلان عليها حسب الشكل التالي :&#, } رقم الحرف ׀ عمل الحرف { مثال : &#91 ؛ يعني TAB ث) الوحدات القياسية : الوحذات القياسية تمكن من القيام بعملية الإستبدال داخل تعريف الأوسام ولها نفس محتوى الوحدات العامة ولكنها غالبا ما تكون نص SGML ويتم الإعلان عنها بهذه الصيغة : > !ENTITY , % , إسم الوحدة , محتوى الوحدة < مثال : > !ENTITY , % , جزء (عنوان, فقرة +) < الإستعمال : > !ELEMENT مقدمة - - ( % جزء+ | PCDATA ) < وهكذا نكون تقريبا قمنا بتقديم أهم مكونات و قواعد الأنموذج (DTD ) و إن أشهر DTD وضع إلى حد الآن هو HTML . 3.3.3 النص SGML : وهو يحتوي على نص المؤلف و الأوسام.يجب أن تحترم القواعد التي تم ضبطها داخل DTD أثناء عملية توسيم (توصيف أو تأشير) النصيجب أن يكون مهيكلا حسب عناصر و كل عنصر يجب أن يكون محاطا ب : معلم بداية > إسم العنصر< (> عنوان< ) معلم نهاية > /, إسم العنصر < (> / عنوان<)- بعض العناصر يكون لها خاصيات معينة - إسم و بنية العنصر معرفان في DTD - يمكن داخل النص أن تقع الإحالة على وحدات عامة ( داخلية و خارجية ) تكون دائما معرفة داخل DTD و تكون الإحالة حسب هذه الصيغة : &, إسم الوحدة , - يمكن أن يحتوي النص على تعليمات خاصة مجهولة بالنسبة ل SGML و تقع معالجتها عن طريق برامج محددة 3.4 مثال تطبيقي و الآن سنقوم بتطبيق كل ما قدمناه بتقديم مثال لوثيقة بسيطة و هي رسالة أعمال و سوف نبتدأ بضبط البنية المنطقية و من ثمة نقوم بإنشاء DTD خاص بهذا النوع من الوثائق لأنه يجب تحديد الوحدات المنطقية المكونة لوثيقة ما لنتمكن من إنشاء DTD و ثم سنقوم توصيف رسالة حسب هذا DTD- البنية المنطقية لرسالة أعمال : DTD ( ملف : رسالة. dtd ) :< !DOCTYPE رسالة ] < !ENTITY سلام " تقبلوا أطيب تحياتي القلبية " >< !ELEMENT رسالة - - (صديرة , الجوهر , النهاية ) >< !ATTLIST رسالة معرف الرسالة ID #REQUIRED >< !ELEMENT صديرة - 0 ( التاريخ , الباعث, المرسل إليه*, الموضوع ؟ ) > < !ELEMENT الجوهر - 0 ( فقرة +) > < !ELEMENT النهاية - 0 ( تحية, (الإمضاء& (إسم الباعث& خطة الباعث؟)))>< !ELEMENT ( التاريخ, المرسل, المرسل إليه , الموضوع) - 0 #PCDATA >< !ELEMENT ( فقرة , تحية ,إسم المرسل , خطة المرسل ) - 0 #PCDATA >< !ELEMENT الإمضاء - 0 #EMPTY >< !ATTLIST الإمضاء أنظر ملف ENTITY #REQUIRED >[ > توصيف الرسالة :< !DOCTYPE رسالة SYSTEM < !ENTITY إمضاء محمد العابد SYSTEM C : signat.gif >[< رسالة معرف الرسالة = 1 > < الصديرة > <التاريخ> 15-.7-.3 </التاريخ> <المرسل> الإدارة </المرسل> < المرسل إليه> علي أحمد </المرسل إليه> <الموضوع> مراكز مصادر التعلم </الموضوع> </الصديرة><جوهر> <فقرة> أأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأأ......... ....أأأأأأأأأأأأأأأأأأأأأأأ</فقرة> <فقرة> ببببببببببببببببببببببببببببببببب.............بببب ببببببببببببببب</فقرة> <فقرة> تتتتتتتتتتتتتتتتتتتتتتتتتتتتتتتتت..............تتت تتتتتتتتتتتتتتت</فقرة></جوهر> <النهاية> <تحية> &سلام؛</تحية> <الإمضاء أنضرملف = &محمد العابد> < خطة المرسل> المدير العام </خطة المرسل> </نهاية></رسالة> 3.5 الخلاصة : إن SGML لغة مرنة جدا وناجعة فهي تمكننا من هيكلة و توصيف آلاف الأنواع من الوثائق التي ينتجها الإنسان خلال ممارسة نشاطاته إبتدائا من المخطوطات ووصولا إلى الوثائق التقنية الخاصة بصناعة هياكل الطائرات و لكن في المقابل فإن إنشاء أنظمة SGML هو أمر غاية في التعقيد و مكلف جدا جدا مما جعل هذه التطبيقات حكرا على المنضمات العالمية مثل الأمم المتحدة أو كبريات دور النشر العالمية و كذلك لا يفوتنا أن نذكر بأن SGML نشأ داخل بيئة النشر أي في الحققية نتحدث عن سلسلة SGML حيث أن كل من DSSSL و SPDL هي لغات متكاملة كليا لكي تمكن من الطباعة و النشر و هذا ما جعل SGML فقيرا فيما يخص إنشاء الروابط و التصرف في النصوص الفائقة نظرا لأن كل من يعرف هذه اللغة يدرك مدى صعوبة و تعقيد عملية إنشاء الروابط التشعبية إعتمادا على SGML كما أن عملية التصقح لوثائق SGML تستلزم تحميل DTD و الذي يكون عادة ضخما فيجعل عملية التصفح ثقيلة جدا إذا فكل هذا جعلSGML غير ملائم للواب و لو أننا نشهد الآن ظهور بعض التطبيقات لكنها حكرا على فئة مختصة جدا.إذا فمحاولة تجاوز محدودية HTML و الإستفادة من غنى و مرونة SGML بدون الوقوع في تعقيدات هذا الأخير تم إنشاء XML 4 اللغة التأشير المتوسعة XML4.1 لمحة تاريخية والتعريف إن لغة التأشير الموسعة XML ( EXTENSIBL MARCUP LANGUAGE ) تم وضعه من قبيل فريق عمل] XML Working Group [ (في البداية عرف بإسم هيئة فحص .... SGML ] SGML Editorial Review Borard [ ( تحت إشراف w3c سنة 1996 و تم الإعلان النهائي على هذه اللغة في 10 فيفرييه 1998 وهي صورة مخففة أو مبسطة من SGML حيث تم حذف أغلب الخيارات حتى يسهل إستعماله وهو أكثر مرونة من HTML حيث أن الأوسام غير محددة مسبقا مما يجعله أكثر ملائمة لأصناف متعددة من الوثائق 4.2 الأهداف - لغة XML وضعت خصيصا للإنترنت و الإنترانيت - نشر وثائق SGML بدون الحاجة إلى كتابة DTD .-إستقبال و معالجة وثائق SGML دون معرفة DTD . -يجب على XML أن يمكن من تأشير العديد من أصناف الوثائق -يجب أن تكون تطبيقات XML سهلة الإحداث وهذا يعني : يجب أن تكون صياغة وثيقة XML سهلة يجب أن تكون عملية إعداد برنامج يمكن من إنشاء و تصفح وثائق XML سهلة - يجب أن تكون لغة XML متوافقة مع SGML - يجب أن تكون لغة XML بسيطة ( التقليل من عدد الخصائص الإختيارية ) - يجب أن يكون النص المكتوب بلغة XML قابلا للقرائة ( على الأوسام أن تكون ذات دلالة )4.3 الفــــروق بين XML و SGML 4.3.1 داخل الأنموذج - ليس هنالك إعلان SGML ( تركيبة XML ضمنية ) - ليس هنالك إستثناء (التلازم , عدم التلازم ) داخل DTD - إختفاء بعض أنواع الخاصيات مثل ( NAME(S),NUMBER(S),NUTOKEN(S) )- ليس هنالك تصغيرات كل المعالم واجبة - ليس هنالك قيمة ضمنية من نوع : CURRENT , CONREF - ليس هنالك إعلان عن وحدات CDATA , SDATA , SUBDOC- التخلي عن خيارات مثل : CONCUR , Link 4.3.2 مفــــهوم الوثيقة حسنة الإنشاء : إن الوثيقة الحسنة الإنشاء هي وثيقة تكون بنيتها معبر عنها من خلال توسيمها و يمكن إعتبارها شجرة عناصر حسنة التضامم إن DTD الوثيقة حسنة الإنشاء يمكن أن يكون مجهولا ( غير موجود ) و بالتالي فوثبقة XML تبقى قابلة للإستغلال بدون DTD و بالتالي فهي ليست بالضرورة صالحة من ناحية SGML . 4.3.3 XML يستعمل UNICODE : إن UNICODE هو شفرة الحروف المرجعية بالنسبة ل XML 4.4 أمثلــــــة :4.4.1- سوف ننشأ وثيقة XML تخص ملف أحد المرضى في المستشفى ملاحظة: إن الأوسام (المعالم) لايمكن أن تكون باللغة العربية بالنسبة للXML< encoding = "UTF-8 " " ?XML version ="1.0 >< !DOCTYPE patient [< ! ELEMENT patient (ecivil, diag, exam+, soin+)>< ! ELEMENT ecivil (name, forname+, photoid ? , adresse , tel?, birth )>< ! ELEMENT name (#PCDATA)>< ! ELEMENT forname (#PCDATA)>< ! ELEMENT photoid (#EMPTY)><! ATTLIST photoid XML-LINK CDATA #FIXED “ SIMPLE”>------------------------------------------------------------------------------]><patient> <ecivil> <name> محمود </name><forname> العباسي </forname> <adresse> 21 شارع بيرم التونسي,2100 قفصة </adresse> <tel> 216 71 740 474 </tel><birth> 24-10-1959 </birth> <photoid sysad HREF = “http://www.rabta.tn/photo/Mahoud.gif”><diag>إلتهاب السحايا </diag> ------------------------------------</patient> 4.4.2 إعداد وثيقة XML لتسجيلة ببليوغرافية مطابقة لل UNIMARC : كما تعلمون فإننا لن نتعرض ل145 حقلا المستعملة داخل هذا التقنين بل سنكتفي بعض الحقول فقط وهذه ليست إلا إمكانية مبسطة نسوقها كمجرد مثال< ?XML version = "1.0" encoding = "UTF8">< !DOCTYPE Notice Marc [< !ELEMENT 001 #PCDATA>< !ELEMENT 010 (010a,010b)>< !ELEMENT 010a #PCDATA>< !ELEMENT 010b #PCDATA>< !ELEMENT 101 101a>< !ELEMENT 101a #PCDATA>< !ELEMENT 102 102a>< !ELEMENT 102a #PCDATA>< ! ELEMENT 200 (200a, 200b, 200g,200f)> < !ELEMENT 200a #PCDATA>< !ELEMENT 200b #PCDATA>< !ELEMENT 200g #PCDATA>< !ELEMENT 200f #PCDATA>< !ELEMENT 210 (210a,210b,210d)> < !ELEMENT 210a # PCDATA>< !ELEMENT 210b # PCDATA>< !ELEMENT 210d #PCDATA> ..< !ELEMENT 700 (700a, 700b)>< !ELEMENT 700a #PCDATA>< !ELEMENT 700b #PCDATA>< !ELEMENT 801 (801a, 801b, 801c)><!ENTITY CONT " تونس ">< !ENTITY Agency " المكتبة الوطنية التونسية ">< !ELEMENT 801a #CDATA > < !ELEMENT 801b #CDATA>< !ELEMENT 801c #CDATA>.………………………………………)]< Notice Marc> <001 >معرف التسجيلة </001> <010> <010a>ردمك</010a> <010b>الثمن </010b> </010> <101> <101a> لغة النشر</101a></101> <102> <102a> بلاد النشر</102a></102> <200> <200a> العنوان </200a> <200d> العنوان الموازي </200d> <200 e> المؤلف </200 e > <200 f> بيان المسؤولية الثناوية </200f> </200> <210> <210a> مكان النشر </210a> <210b>عنوان الناشر </210b> < 210c>الناشر </210c> < 210d>تاريخ النشر </ 210d> </210> . . <700> <700a> إسم المؤلف </700a> <700b> الإسم العائلي </700b> </700> < 801> <801a> &contry </801a> <801b> &Agency</801b> </801>-------------------------------------------------</ Notice Marc>4.5 XML و تنوع ا لروابط التشعبية :4.5.1 تعريف الرابط التشعبي : الرابط التشعبي هو رابط بين وحدات مثل الوثائق و أجزاءا من الوثائق يعبر عن علاقة منطقية بين مختلف هذه الوحداتكل رابط تشعبي يجب أن يكون له على الأقل طرفين 4.5.2 أنواع الروابط داخل XML :يعتبر تنوع الروابط التشعبية من أهم نقاط قوة لغة XML - الروابط آحادية و ثنائية الإتجاه - الروابط المحددة خارج الوثيقة- روابط التجميع - روابط التحويل و الإدماج - الروابط الحلقية و المتعددة النوافذ- الروابط المحددة ديناميكيا كل هذا التنوع سمح بظهور لغة داخل XML خاصة بالروابط و هي XLL (Extensible Linking Language ) 4.5.3 تعريف الروابط داخل XML إن الرابط هو عنصر XML و يعرف إعتمادا على الخاصية XML-LINK التي يمكنها أن تأخذ خمسة قيم وهي : SIMPLEEXTENDEDLOCATORGROUPDOCUMENTخصائص أخرى تضاف إلى الرابط :Attribut ROLE : مدلول الرابط Attribut HREF : عنوان المصدر ( URL أو URN )Attribut TITLE : تدقيق نوعية المصدر Attribut SHOW و يمكن أن يأخذ ثلاث قيم وهي :NEW : التصفح يتم في صفحة جديدة EMBED : يجب أن تنشر صفحة الهدف داخل صفحة الإنطلاق في مكان الرابط REPLACE : تقع عملية تعويض لصفحة الإنطلاق بصفحة الهدف عند ضغط الرابط Attribut ACTIVATE : هذه الخاصية تضبط شروط تفعيل الرابط AUTO : يتجه المبحر مباشرة إلى طرف الرابط USER : تقع عملية تنشيط الروابط من طرف المستفيد 4.6 مفهوم المصدر العالمي للأسماء (Universal Ressource Name ) : لا شك في أن كل من تعود الإبحار على الإنترنت يعلم عدد الروابط الغير صالحة للإستخدام و ما تسببه من شعور بالخيبة خاصة عندما نقضي وقتا طويلا في البحث عن معلومة معينة ثم يتبين لنا أن الصقحة لم تعد موجودة في مكانها و إن بعض الإحصائيات تشير إلى أن نسبة الروابط الغير صالحة تصل إلى 80% من العدد الجملي للروابط الموجودة على الواب . و سبب هذه المشكلة هو أن نعتمد على العنونة الفيزيائية للوثاق Universel Ressource Locator و التي تعتمد على إسم الموزع الذي توجد بداخله الوثيقة وبذلك فبمجرد إستبدال موزع الإيواء نفقد صلوحية الرابط و URL له الصيغة التالية الأسلوب : // إسم الموزع: المنفذ / الملف] # إسم المشير داخل الملف | ؟معلمات (الأسئلة)[الحل المقترح هو :العنوان المنطقي لمصدر ما وهو يتكون من: إسم المجال , إسم الوثيقة وهكذا فلو أنه تم إستبدال الموزع فيمكن دائما الوصول إلى الوثيقة لكن هذه التقنية مازالت في طور التجربة و سو ف نقدم عنوان موقع مجلة المعلوماتية كمثال URL :http://www.moe.gov.sa/stdafrs/librar...s/index.htmURN العنوان المنطقي : //moe:: stdafrs// DOCUMENT index.htm//sa 4.7 برامج معلوماتية تخص XML :برامج تخص إنشاء وثائق XML : - شركة MICROSOFT أدخلت XML على كل برامج OFFICE إذا فيمكن إنشاء وثيقة XML بإستعمال برنامج wordVisual XML - http: // www.pierlou.com/visxml/ :برامج تخص تصفح وثائق XML : - Inertnetexplorer إبتداءا من النشرة 5.5 تحت نضام التشغيل windows - mosaique تحت نضام التشغيل LUNIX - MAYA و هو برنامج تصفح تم إحداثه من طرف w3c5- تجـــارب و تطبيقـــــات XML : لقد شهد XML تطبيقات في عديد المجالات بهدف تسهيل عملية تبادل الوثائق بين المختصين في نفس المجال نخص بالذكر منها :MATHML - (Mathematical Markup language) وهو أنموذج حسب XML لتوصيف وثائق العلوم الرياضية و يمكن الإطلاع على هذه اللغة على العنوان التالي : http://www.w3.org/TR/REC-MathML/CM L - ( Chemical Markup Language) وهو أنموذج حسب XML لتوصيف وثائق العلوم الكيميائية ويمكن الإطلاع على هذه اللغة على العنوان التالي : http://www.xml-cml.org/- كما إن ل XML تطبيقات عديدة داخل عالم المكتبات ومن بين هذه التطبيقات نشير إلى مشروع BIBLIOML الذي تشرف عليه وزارة الثقافة الفرنسية و هو تطبيق XML لتوصيف التسجيلات الببليوغرافية المطابقة لل UNIMARC و يهدف في مرحلة أولى إلى إنشاء فهرس موحد للمكتبات الفرنسية في مجال علوم الأرض ويمكن الإطلاع عل هذا المشروع و تحميل DTD الذي و قع إنشاءه على العنوان التالي : http://www.biblioml.org/- إستعمال XML كشكل بديل عن ISO2709 لتبادل المعطيات الببليوغرافية : نذكر على سبيل المثال البرنامج التوثيقي WINISIS الصادر عن UNESCO في نشرته 1.4 يمكننا من إسترجاع التسجيلات الببليوغرافية حسب XML 6- الخـــــلاصـــــــــة :إن لغة XML ورثت مميزات كل اللغات التوصيفية التي سبقتها و تجوازت مجمل نقائصها مما جعلها لغة المستقبل للبيئة الرقمية و بما أن عالم المكتبات هو عالم مفتوح يهدف إلى تسهيل تبادل المعلومات و إيصالها للمستفيدين إذا فإن XML هي لغة ملائمة جدا لقطاع المكتبات و قد عرضنا بعض هذه التطبيقات لكن التعمق في هذا الموضوع يتطلب مقال منفرد .7 - المــــصــادر - أتوجه بالشكر إلى الأستاذ Jean-Marie. Pinon الذي بفضل إرضائه لفضولي العلمي تمكنت من إستيعاب بعض المفاهيم التي ساعدتني على كتابة هذا المقال- بالنسبة للمصطلحات العربية فقد و قع إعتماد : - مشروع معجم مصطلحات المعلوماتية : إنجليزي- فرنسي-عربي / المنظمة العربية للتربية و الثقافة و العلوم - المواقع العربية التي تتطرق إلى نفس المواضيع - HTML عربي- http://www.arabbuilder.com/learn/lessons/html/index.php - http://www.khayma.com/hpinarabic/htmintro.html- إفرنجي - http://www.w3.org/MarkUp/Activity - http://www.yourhtmlsource.com/starthere/whatishtml.html - http://www.utoronto.ca/webdocs/HTMLd...tmlindex.html- XML - عربي- http://www.dev4arabs.com/ar/xml/ http://linux.atlink.it/linuxfocus/Ar...icle242.shtml- إفرنجي- http://www.w3.org/XML/- http://babel.alis.com/web_ml/xml/REC-xml.fr.html- http://www.ucc.ie:8080/cocoon/xmlfaqحسن عليةالمستوى العلمي : متحصل على شهادة المرحلة الثالثة لدراسات العليا المتخصصة في التصرف في المكتبات التكوين الأساسي متحصل على شهادة الأستاذية في الرياضيات












  رد مع اقتباس