تبليغاتX
Metadata

Metadata

این روزهای زمستانی حال و هوای تابستان 85 را دارم. تصمیم گرفتم که دوباره یافته های پژوهش پایان نامه ام را مرور کنم. این تصمیم متعلق به همان تابستان است البته از نوع 88 آن و این چند روز جستجوهایی را انجام دادم برای دیدن نتیجه ای که انتظارش را داشتم. 

پایان نامه ارشدم را بر روی اثربخشی عناصر ابرداده ای کار کرده بودم در سه موتور کاوش گوگل، یاهو و ام اس ان. مقاله اش را به چاپ رسانده ام که با دنبال کردن این لینک می توانید به آن دسترسی داشته باشید. اما می خواستم بدانم که آیا هنوز هم رویه موتورهای کاوش همان است که بود یا خیر. اگر چه هنوز آزمون های آماری را اجرا نکرده ام اما از روی داده ها تا حدی مشخص است که نتایج قبلی معتبر خواهد بود. به این کار می گویند یاد ایام گذشته البته از نوع علمی.

+ نوشته شده در  سه شنبه هفدهم آذر 1388ساعت 10:48  توسط شريف  | 

کتاب های زیادی درباره ابرداده – یا همان فراداده، به گفته برخی- وجود دارد. البته به زبان انگلیسی! که مطالعه آن ها خالی از فایده نیست. برخی از این کتابها با رویکرد مهندسی کامپیوتر نوشته شده اند و گاه مطالعه آن ها برای دوستان کتابداری مشکل به نظر می رسد. البته فقط به نظر می ر سد!!
در این نگاره، قصد دارم یکی از کتاب هایی را که از تنور نمایشگاه کتاب تهران درآمده است و به ابرداده می پردازد معرفی کنم.
این کتاب، محصول 2008 است و دو نویسنده آن به نوعی با حوزه کتابداری و اطلاع رسانی پیوند خورده اند.
Jenn Riley نویسنده دوم این کتاب با عنوان Metadata Librarian  معرفی شده است. این کتابدار، مسئول برنامه کتابخانه دیجیتال دانشگاه ایندیاناست و در نگارش این کتاب سهم داشته است.
مطالعه این کتاب را به دوستانی که تمایل دارند با نگاهی کتابدارانه به مسئله ابرداده نگاه کنند و البته از سایر زوایا نیز غافل نباشند توصیه می کنم. متن روان است و توالی منطقی محتوا رعایت شده است.

برای این که کار شما را آسان کرده باشم بخشی از فهرست مندرجات را در این جا می آورم :

Part 1: introduction
What is metadata

Part 2: implementation of metadata creation activities
Choosing metadata standards for digital library project
Creating metadata usage guidelines
Creating metadata
Practical implementation of metadata strategy

Part 3: systems design
Functions preformed by digital library system
Metadata that drives discovery functionality

Part 4: Metadata interoperability
Defining interoperability
Interoperability and resource discovery
Technical interoperability
Content interoperability: shareable metadata

Part 5: conclusion
The future of metadata

 

سایر مشخصات کتابشناختی کتاب به این شرح است:

Foulonneau, Muriel; Riley, Jenn (2008). Metadata for digital resources: implementation, systems. Design and interoperability. Oxford: Chandos Publishing.

 

+ نوشته شده در  شنبه پنجم مرداد 1387ساعت 10:46  توسط شريف  | 

موضوع این پست، دقیقا چیزی بود که در پایان نامه ارشدم به آن پرداخته بودم. اگر چه دو سال از دفاع من می گذرد و مقاله آن نیز به چاپ رسیده است اما بد نیست در صورت علاقه به این مباحث به متن اصلی مقاله رجوع کنید. متن اصلی مقاله به زبان فارسی و در پایگاه دسترسی باز E-LIS  دسترس پذیر است. متن کامل مقاله همچنین در سایت نشریه کتابداری و اطلاع رسانی آستان قدس نیز قابل پیگیریست.

 

عنوان:بررسی میزان اثربخشی عناصر ابرداده اي بر رتبه بندي صفحات وب توسط موتورهاي کاوش عمومی

چکیده: پژوهش حاضر با هدف تعيين ميزان اثربخشي عناصر ابرداده‌اي بر رتبه‌بندي صفحات وب توسط سه موتور کاوش عمومي «گوگل»، «ياهو»، و «ام‌اس‌ان» انجام پذيرفت. اثربخشي پنج عنصر ابرداده‌اي نشانه عنوان زبان «اچ‌.تي.‌ام.‌ال»، ابرنشانه‌هاي کليدواژه‌ها و توصيف زبان «اچ.تي.ام.ال»، ابرداده‌هاي عنوان و موضوع از قالب ابرداده‌اي «دابلين کور» که بر بازنمون موضوعي صفحات وب متمرکزند، با روش تجربي آزموده شد. 84 صفحة وب در گروههاي گواه و آزمون به عنوان جامعة مورد مطالعه تحت دامنة فرعي http://metadata.irandoc.ac.ir منتشر شد. از ميان موتورهاي کاوش انتخابي، دو موتور کاوش ياهو و گوگل، صفحات را نمايه‌سازي کردند. کليدواژه‌هاي منحصر به فرد و تکرار شونده که در مرحله طراحي در قالب عناصر ابرداده‌اي به صفحات گروه آزمون افزوده شده بود، بررسي شد و ميزان معني‌داري تفاوت رتبه صفحات دو گروه با استفاده از آزمون غيرپارامتري «يو.من.وايتني» محاسبه گرديد. نتايج، نشانگر اثربخشي دو عنصر «عنوان» و «توصيف زبان اچ.تي.ام.ال» در هر دو موتور کاوش مورد مطالعه است. کليدواژه‌هاي منحصر به فرد در ابرنشانه کليدواژه‌هاي «اچ.تي.ام.ال» و ابرداده موضوع دابلين کور به بهبود رتبه صفحات در ياهو انجاميد. در حالي که تکرار کليدواژه‌ها در بخش سرآيند صفحه وب، باعث بهبود رتبه در موتور کاوش ياهو شد، گوگل عملکردي معکوس داشت.

 

+ نوشته شده در  چهارشنبه چهارم اردیبهشت 1387ساعت 13:3  توسط شريف  | 

در پست قبلی به نقل از برخی صاحبنظران نوشتم که یک سایز مناسب همه نیست! به همین دلیل است که طرح های ابرداده ای متنوعی با اهداف متنوع و برای کاربرانی در سطوح متفاوت تعریف و ارائه شده است. یکی از ساده ترین طرح های ابرداده ای که البته در اهداف اولیه اش سادگی و سهولت کاربرد را مدنظر قرار داده است، دابلین کور می باشد. طرح ابرداده ای دابلین کور با 15 عنصر ابرداده ای برای توصیف مواد شبه مدرک در شبکه جهانی وب تدوین شد. عناصر دابلین کور که از جمله آن ها می توان به "عنوان"، "موضوع"، "تاریخ" اشاره کرد عناصری قابل فهم است و به طور هسته قابلیت توصیف مدارک با این عناصر وجود دارد. سایر قالب های ابرداده ای در سطوح متفاوتی از توصیف قرار دارند.

دیده ام که بعضا برخی دوست دارند طرح ابرداده ای ویژه ای را مناسب تر از دیگری نشان دهند غافل از اینکه تناسب را چیزی فراتر از نوع عناصر و سطح توصیف آن ها تعیین می کند. هیچ کس نمی تواند کتاب ساده شده کلیله و دمنه را با متن اصلی آن مقایسه کند و متن اصلی را مناسب تر تلقی نماید چرا که متن ساده شده برای مخاطبانی ویژه بازنویسی شده است و نه برای کسی که دانش درک متن اصلی کلیله و دمنه را دارد.

پس به نظر می رسد که تناسب، حاصل جمع پارامترهایی است که نه یک بعدی، بلکه چندبعدی است. یکی از مهمترین ابعاد آن که اغلب مورد غفلت قرار می گیرد سطح مخاطبان و کاربران است. مقوله ای که به ویژه در علوم کتابداری و اطلاع رسانی وزن ارزشی بیشتری به خود اختصاص می دهد.

+ نوشته شده در  دوشنبه هشتم بهمن 1386ساعت 17:52  توسط شريف  | 

انواع طرح های ابرداده ای در حال گسترش و پالایش اند. طرح های متنوع، در خدمت نیازها و مخاطبان متفاوت است و فهرست های معتبری از آنها در سایت کتابخانه کنگره آمریکا آمده است (کتابخانه کنگره آمریکا، 2006). برخی محققان بر مبنای میزان غنای طرح های ابرداده ای طیفی از طرح های ابرداده ای ترسيم كرده اند. همان گونه که در فهرست نویسی سطوح توصیف 1، 2، و 3 مطرح است؛ سطوح مختلفی از توصیف در مورد طرح های ابرداده ای نیز قابل بحث است. تنوع در سطوح توصیف به واسطه تکرارپذیری و گسترش پذیری در برخی از فیلدهای عناصر ابرداده ای و اجباری یا اختیاری بودن عناصر ایجاد شده حاصل مي گردد (بارنت، ان جی، و پارک، 1999، ص 1213).

طیف ابرداده های غنی با طرح های بسیار فنی از قالبی چون مارک و سرآیند طرح کدگذاری متن (TEI header )  آغاز و به طرح های ساده تری چون دابلین کور می رسد (لی-اسملتزر، 2000، ص 207). واضح است که یک سایز مناسب همه افراد نخواهد شد! فهرست نویسی سنتی در کتابخانه ها، پیشینه های مارک و طرح های ابرداده ای متنوع هر یک جایگاه، كاربرد و مخاطبان ویژه خود را دارند. برخی از منابع توصیف مفصل تری را طلب می کند در حالیکه در مورد برخی دیگر، طرح ابرداده ای ساده ای چون دابلین کور کافی است (لی-اسمتلزر، 2000، ص213).

از زاویه ای دیگر توصیف منبع در سطوح مختلفی انجام می پذیرد. توصیف منبع می تواند در سطح مجموعه، منبعی انفرادی و یا بخشی از منبع (مانند یک عکس در یک مقاله) صورت گيرد. در فهرست نویسی تصمیم گیری در باب اینکه آیا مجموعه ای چندجلدی در یک پیشینه قرار گیرد و یا هر یک از مجلدها به طور جداگانه فهرست نویسی شود، انجام می پذیرد. تولید کننده ابرداده نیز تصمیمی مشابه در مرحله تولید ابرداده اتخاذ می کند (سازمان استاندارد اطلاع رسانی ملی، 2004 ، ص2).


ادامه مطلب
+ نوشته شده در  دوشنبه هشتم بهمن 1386ساعت 14:2  توسط شريف  | 

طرح هاي ابرداده اي را به طور كلي در سه دسته قرار مي دهند:

ابرداده توصیفی‎ (descriptive) ‎‏: این نوع ابرداده، به توصیف منبع با هدف کشف و شناسایی می پردازد. عناصری ‏چون عنوان، چکیده، پدیدآور، و کلیدواژه از جمله عناصر معمول در این نوع از ابرداده هاست.

ابرداده ساختاری‎ (structural) ‎‏ : این نوع ابرداده، چگونگی ترکیب اشیاء اطلاعاتی را مشخص می سازد؛ به طور ‏مثال، مشخص می كند صفحات در یک فصل چگونه تنظيم شده اند.

ابرداده مدیریتی‎(administrative)‎‏: این نوع ابرداده، مدیریت منبع را عملی می سازد. اطلاعاتی چون زمان، ‏چگونگی ایجاد فایل، اطلاعات مربوط به فراهم آوری، حقوق، اطلاعات مربوط به مکان یابی، کنترل نسخه ها و ... در این گروه ‏جاي مي گيرد (سازمان استاندارد اطلاع رسانی ملی ، 2004؛ ‏Cordiro, 2004‎‏).

ابرداده های مدیریت حقوق و ابرداده های حفاظتی را می توان زیر مجموعه ابرداده های مدیریتی یا به طور مجزا مورد ‏بحث قرار داد. اما انواع طرح های ابرداده ای با تمرکز بر نوعی از ابرداده، تولید و توسعه یافته اند؛ به طور مثال طرح ابرداده ای ‏دابلین کور بر ابرداده های توصیفی متمرکز است.‏
+ نوشته شده در  چهارشنبه پنجم اردیبهشت 1386ساعت 19:33  توسط شريف  | 

چند روزي است كه به مطلبي ناراحت كننده فكر مي كنم و آن اينكه بعد از مدتها چيزي به وبلاگم اضافه نشده است. به ‏دلايل اين امر نمي پردازم كه "مثنوي هفت من كاغذ" مي شود؛ اما همين نكته كافي كه اين چند مدت درگير مطالعات ديگري ‏بودم كه مرا از وادي موضوعات وبلاگم تا حدي دور ساخته است. به هر تقدير در اين پست مي خواهم مطلبي در مورد ابرداده ‏ها بنويسم و آن مفهوم طرح ابرداده اي است.

طرح (‏Schema‏) ، یا استاندارد ابرداده ای به مجموعه ای از عناصر ابرداده ای اطلاق می شود که با هدفی ویژه چون ‏توصیف نوع خاصی از منابع اطلاعاتی تدوین شده است (سازمان استاندارد اطلاع رسانی ملی، 2004، ص2). عنوان، موضوع و ‏پدیدآور از جمله عناصر ابرداده ای قابل تعریف در طرح ابرداده توصیفی به شمار می روند. در كنار مجموعه عناصر ذكر شده ‏دسته اي از قواعد (‏Rules‏) ، چگونگي كاربرد عناصر را ضابطه مند مي سازند. به اين گونه كه طرح شامل مجموعه اي از عناصر ‏به علاوه قواعد به كارگيري آن عناصر است.

هر عنصر ابرداده ای شامل نام، معنا ‏‎(semantic)‎‏ ، و محتواست‏‎(content) ‎‏ "عنوان" می تواند نام یک عنصر ابرداده ای ‏باشد که یکی از خصیصه‎ (Property) ‎های اصلی بسیاری از منابع اطلاعاتی به شمار می رود. "عنوان" معنایی دارد که قابل ‏تعریف و درک است، وبه اين معنا در طرح ابرداده ای اشاره می شود. هر عنصر با توجه به نوع، ارزش‎ (value) ‎‏ یا مقداری – ‏محتوا – را به صورت رشته‏‎ (string) ‎‏ ای عددی، حرفی، یا عددی- حرفی می پذیرد. عنصر ابرداده ای به همراه مقدار اختصاص ‏یافته به آن در بستر نحوی مناسبی ارائه می شود. در حال حاضر از بسترهای نحوی اس جی ام ال‎ (Standard General ‎Markup Language : SGML)‎‏ و ایکس ام ال‏‎ ‎جهت ارائه محتوای ابرداده ای استفاده ای گسترده به عمل می آید (سازمان ‏استاندارد اطلاع رسانی ملی، 2004، ص2) اما برخی قالب های ابرداده ای فاقد نحو تجویزی هستند، كه به آنها طرح های ‏مستقل از نحو گویند. در این صورت جفت عنصر ابرداده ای/مقدار در هر نحو تعریف شده ای قابل کدگذاری و ارائه است.


‎‏ ‏‏‏
+ نوشته شده در  چهارشنبه پنجم اردیبهشت 1386ساعت 19:18  توسط شريف  | 

ابرداده را از دو ديدگاه مورد بررسي قرار داده اند:

  • از ديدگاه كنترل كتابشناختي (Bibliographic control) و
  • از ديدگاه مديريت داده (Data management)

در دیدگاه نخست تمرکز بر توصیف، جایابی و بازیابی اطلاعات با توجه به اصول سازماندهی در نظام ذخیره و بازیابی است. این رویکرد که طرفدارانی در حوزه کتابداری و اطلاع رسانی دارد با هدف بازنمون شيئ اطلاعاتی(representation)  به منظور تسهیل دسترسی به آن شکل گرفته است (بارنت، ان جی، پارک، 1999).شاید بتوان ادعا کرد كه این رویکرد در توسعه و پالایش طرح های ابرداده ای توصیفی نقش پررنگ تری داشته است. در ديدگاه كنترل كتابشناختي، ظهور ابرداده منجر به پررنگ شدن تفاوت مفهومي انتقال اطلاعات در مقابل ذخيره اطلاعات شده ؛ اگر چه در بیشتر طرح های ابرداده ای به هر دو کارکرد – توصیف و کشف منبع(resource discovery)  -  توجه شده است (کمپل، 2004، ص 190). در پارادایم ذخیره اطلاعات تاکید بر توصیف و در پارادایم انتقال اطلاعات نقطه توجه بر کارکرد کشف منبع قرار گرفته است.

 در رویکرد دوم-  رویکرد مدیریت داده - تمرکز بر خود داده و استفاده از آن است؛ به این ترتیب علاوه بر توصیف، بر حفاظت، اشتراک و یکپارچه سازی داده ها با هدف استفاده مجدد نیز تاکید می شود. طرفداران این دیدگاه را متخصصان رایانه تشکیل می دهند. این دو رویکرد اگر چه از زاویه های متفاوتی به مقوله ابرداده نگریسته اند، ناسازگار و فاقد نقاط مشترک نیستند. با نظر به هر دو رویکرد می توان به تعریفی واحد از ابرداده رسید:

ابرداده، داده ای است که ویژگی های منبع را مشخص می سازد، روابط را توصیف می کند، و کشف منبع  و استفاده موثر از منبع را میسر می سازد (بارنت، ان جی، پارک، 1999، ص 1212).

Burnett, K.; Ng, K.B.; & Park, S. (1999). “ A Comparison of the  Two Traditions of Metadata Development” . Journal of the American Society for Information Science, 50 (13), 1209-1217.  Retrieved Oct, 12, 2005, From John Wiley & Sons Database

Campbell, D.G. (2004). “The Metadata – Bibliographic Organization nexus” In Metadata Applications and Management. London: Facet Publishing, 185-203.

.

+ نوشته شده در  چهارشنبه بیست و دوم آذر 1385ساعت 13:35  توسط شريف  | 

شاید بد نباشد اولین مطلب تخصصی را با مفهوم ابرداده آغاز کنم. ابرداده را "داده درباره داده" ، "اطلاعات درباره اطلاعات"، "داده ساخت یافته درباره داده" تعریف کرده اند. شاید در ظاهر تعریف های ارائه شده گویا و خالی از ابهام باشد اما اگر کمی توجه کنید درخواهید یافت که مفاهیمی چون "داده" ، "اطلاعات" و "ساخت یافته" در این تعریف ها، خالی از ابهام نیست. این سوال پیش می آید که چرا در یک تعریف اطلاعات به جای داده قرار گرفته است؟ این سوالات را در ذهن داشته باشید و سعی کنید با تفکر در مورد آنها به جواب برسید. مقالات خوبی هم در این زمینه نوشته شده است که می توانید به آنها هم رجوع کنید.

 

گرینبرگ(Greenburg)  ابرداده را این چنین تعریف می کند:

"داده ساخت يافته(structured data)  درباره داده به گونه اي كه از عملكرد آن شيئ (object) در ارتباط با ساير اشیاء پشتيباني كند."

گرینبرگ با نگاهی شیئ گرا (object-oriented)  به این مقوله پرداخته است. بهتر است در اینجا توضیح بیشتری درباره این تعریف ارائه شود.

بخش نخست تعريف، داده ساخت يافته، بر ساخت نظام يافته اي تاکید دارد که بر مبنای طرح ابرداده اي (Metadata Schema )شکل گرفته است. اصطلاح مياني تعريف، شيئ، هر نوع موجوديت (Entity)، شكل (form) و يا حالت  (mode)از شيئ اطلاعاتي را شامل مي شود. شيئ را " هر جزئي از جهان قابل تصور ((Conceivable و قابل درك(Perceivable) " مي دانند.  جهان اشیاء ، جايي كه ابرداده كاربرد مي يابد، جهاني متفاوت،  بي انتها و شامل طيفي گسترده از منابع اطلاعاتي ديجيتالي و غير ديجيتالي است. اين جهان از تك نگاشت، روزنامه، يا حتی یک عكس آغاز مي شود و تا فعاليت ها، وقايع، افراد، مكان ها، ساختارها، تراكنش ها(Transactions) ، ارتباطات، و برنامه هاي كاربردي ادامه مي يابد. آخرين جزء تعريف ابرداده به عملكرد ارتباط شيئ با ساير اشیاء تمركز دارد. تمركز و تاكيد در بخش سوم تعریف بر توانايي پشتيباني ابرداده از رفتارها و فعاليتهاي شيئ است. به طور مثال عناصر ابرداده اي "عنوان"، "موضوع"، و "پديدآور" در مدارک، كشف منبع را سهولت مي بخشند، و عناصر ابرداده اي "شماره صورتحساب"، "كد محصول"، "شماره كارت اعتباري" ، و "تاريخ تراكنش مالي" مربوط به خريد كالا است. در هر دو مثال، ابرداده، از كاركرد ويژه شيئ پشتیبانی می کند؛ کارکرد شيئ در مثال اول كشف منبع و در مثال دوم فعاليت خريد است (گرينبرگ، 2002: 245).

Greenberg, J. (2002). “ Metadata and the world wide web”. In Encyclopedia of Library and Information Science. Vol22, (supple.) pp.244-261.

 

+ نوشته شده در  شنبه بیست و هفتم آبان 1385ساعت 16:1  توسط شريف  |