متادیتا،
استانداردها و کاربردهای آن
متادیتا،
استانداردها و کاربردهای آن
محمدتقی فاتحی خواجه
این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید
متادیتا چیست؟
متادیتا، اطلاعات ساخته یافتهای از تعریف، توضیح، مکان و سایر مفاهیم در مورد دیتا میباشد که بازیابی، کاربرد و مدیریت کردن یک منبع اطلاعاتی را آسانتر میکند. متادیتا معمولاً به دستهای از دادهها گفته میشود که جزئیات یک دادهی دیگر را تشریح میکند. اصطلاح متادیتا با ترجمه فراداده، ابرداده، فوقداده و یا دادهنما نیز به کار میرود.
استاندارد فهرست نویسی سنتی در کتابخانهها و قوانین مربوط به آن یک نمونه از متادیتا ساخت یافته میباشد که در کتابخانهها در مورد منابع دیداری، شنیداری اعم از متن، صدا و تصویر استفاده میشود. مدلها و استانداردهای دیگری از متادیتای توسعه یافته تعریف شده است که توصیف کننده انواع مختلف از منابع متنی و غیر متنی شامل کتاب، اسناد الکترونیکی، راهنماهای جستجوی آرشیو، منابع آموزشی، دادههای علمی و سمعی و بصری میباشد.
مجموعه استانداردهای MPEG که کد کردن منابع صوتی و تصویری را در قالب فایلهای کامپیوتری و دیجیتال تعریف میکنند، استانداردهای MPEG-7 و MPEG-21 را برای تعریف متادیتای منابع دیداری و شنیداری معرفی کرده است.
متادیتا چه انواعی دارد؟
متادیتا در کاربردهای مختلف به صورتهای متفاوتی بکار برده میشود. در بعضی از کاربردها آن را به اطلاعات قابل درک توسط ماشین نسبت میدهند در حالیکه برخی دیگر آن را برای رکوردهایی که منابع الکترونیکی را توصیف میکند، استفاده میکنند. در کتابداری، برای هر نوع توضیحات در مورد منابع دیجیتال یا غیر دیجیتال عبارت متادیتا به کار برده میشود و میتواند به برگههای دادهنما اتلاق شود که معمولاً شامل اطلاعاتی مثل نام نویسندهی کتاب، تاریخ چاپ، تعداد صفحات، شمارگان، زبان کتاب، نام مترجم، کلیدواژهها و غیره هستند.
متادیتاهای مربوط به یک منبع بر اساس نوع کاربرد و ویژگیهای آن در دسته بندیهای مختلفی قرار داده میشود که معمولاً در سه دسته بندی اصلی قرار گرفته و به عنوان انواع متادیتاهای رایج شناخته میشود که اطلاعات یک منبع شامل متادیتای توصیفی، متادیتای ساختاری و متادیتای مدیریتی میباشد.
متادیتای توصیفی یک منبع را با هدف شناسایی و پیدا کردن، توصیف میکند که می تواند شامل عنوان، چکیده، نویسنده و کلید واژه باشد.
متادیتای ساختاری نشان میدهد که چطور موضوعات ترکیبی کنار هم قرار داده میشوند و مثلا چگونه صفحات یک فصل در کنار هم در نظر گرفته شدهاند.
متادیتای مدیریتی اطلاعاتی جهت مدیریت منابع را فراهم میکند. یک داده کی و چگونه ایجاد شده، نوع و اطلاعات فنی فایل و اینکه چه کسی میتواند به آن دسترسی داشته باشد. زیر مجموعههای مختلف از متادیتای مدیریتی وجود دارد که مدیریت دسترسی و نحوه نگهداری از این دسته هستند.
متادیتا، هر نوع منبع دادهای را در هر سطحی توصیف میکند. توصیف یک بخش و یا یک مجموعه از منابع و یا جزئی از یک بخش، مثل توصیف یک عکس در یک مقاله را انجام میدهد. از زمانیکه دادههای دیجیتالی رو به گسترش بوده نیاز به متادیتا و تنوع آنها بیشتر شده است بطوریکه اطلاعات ساختاری یک فایل و نحوه نگهداری آن به اطلاعات توصیفی فایل اضافه میشود تا تمایزی بین فایلها برای دستهبندی و دسترسی به آنها وجود داشته باشد.
متادیتا چه کار میکند؟
یک دلیل مهم برای ایجاد متادیتای توصیفی این است که دسترسی به اطلاعات مربوطه را راحتتر کرده و علاوه بر کمک به پیدا کردن اطلاعات به سازماندهی منابع الکترونیکی نیز کمک میکند. هماهنگی و متمرکز کردن اطلاعات مربوط به یک منبع را تسهیل کرده و شناسایی دیجیتالی را فراهم و امکان آرشیو و نگهداری را ممکن میکند.
متادیتا همان کارکرد را دارد که فهرست نویسی در یک کتابخانه دارد و پیدا کردن داده مورد نظر با استفاده از دادههای مرتبط با آن انجام میگیرد و دادهنماها کمک میکنند تا منابع مورد نظر شناسایی، منابع مشابه معرفی و در نهایت منبع مورد نظر قابل تشخیص باشد و در آخر مکان داده را مشخص میکند. در واقع هدف از متادیتا، دستیابی آسانتر و بهتر به دادههای موجود میباشد.
در عکاسی متادیتا در داخل یک فایل عکس نوشته میشود تا مشخص کند که این عکس متعلق به چه کسی است و مالکیت آن با کیست؟ چه دوربینی فایل آنرا ایجاد کرده و در چه زمانی عکس تهیه شده است. اطلاعات توصیفی مربوط به عکس مثل کلمات کلیدی آنرا قابل جستجو در کامپیوتر میکند که برخی از این اطلاعات توسط دوربین و برخی دیگر نیز توسط عکاس و از طریق کامپیوتری نوشته میشود.
در تصویر متادیتا خیلی مفید و کاربردی میباشد به گونهای که اطلاعات محتوای آن مثل توصیف صحنهها و یا متن گفتگوها که مستقیماً برای کامپیوتر مفهوم نیست ولی کار جستجوی محتوا را کارآمد و مطلوب میکند.
با گسترش کاربرد اینترنت، وقتی اطلاعات در یک سایت اینترنتی در دسترس همه قرار میگیرد، در کنار اطلاعات توصیفی و اطلاعات ساختاری که برای فایلهای کامپیوتری تعریف میشود، اطلاعات مدیریتی آن نیز برای کنترل امنیت و نگهداری دادهها، از اهمیت بیشتری برخوردار میشود و در ساختار صفحههای اینترنتی جایی برای متادیتا در نظر گرفته شده است و معمولاً متادیتا در متن یک صفحه وب جاسازی میشود.
در صنعت برودکست متادیتا به رسانههای صدا و تصویر مرتبط میشود تا یک منبع رسانهای را برای تولید کنندگان، توزیع کنندگان و استفاده کنندگان قابل شناسایی، توصیف و دستهبندی کند و امروزه تمام نرمافزارهای مربوطه آنرا پشتیبانی میکنند.
متادیتا کجاست؟
متادیتا میتواند در داخل فایل مربوط به یک منبع دیجیتال جاسازی و یا به صورت مجزا از منبع داده در یک فایل مستقل ذخیره شده باشد که در اینصورت شاید در قالب HTML و یا در سرعنوانهای فایلهای تصویری جاسازی شود. ذخیره کردن اطلاعات در خود فایل داده این اطمینان را ایجاد میکند که متادیتا گم نشده و در هیچ شرایطی ارتباط بین دیتا و متادیتا قطع نخواهد شد و کمک خواهد کرد که متادیتا و دیتا در کنار هم بوده و در صورت نیاز با هم اصلاح و بروز شوند.
از طرف دیگر، جاسازی متادیتا در بعضی از انواع دادهها امکان پذیر نمیباشد و باید توجه داشت که ذخیره کردن جداگانه اطلاعات میتواند مدیریت کردن خود متادیتا و جستجو کردن و بازیابی آن را سادهتر کند و برای همین منظور است که متادیتا معمولاً در یک بانک اطلاعات و مستقل از دادهها ذخیره شده و به منبع توصیف کنندهاش لینک داده میشود تا با سرعت زیاد قابل دسترسی و قابل استفاده باشد.
متادیتا ممکن است در یک فرآیند اتوماتیک و یا با یک فعالیت دستی تولید و ثبت شود. در یک فایل کامپیوتری متادیتای اولیه توسط کامپیوتر و در زمان ایجاد فایل تولید میشود که شامل اطلاعاتی از قبیل زمان ایجاد فایل، ایجاد کننده فایل، آخرین بروز رسانی و سایز آن میباشد. کاربرد و فیلدهای اطلاعات متادیتا خیلی گسترده بوده و محدود کنندهای برای آن وجود ندارد.
به این ترتیب متادیتا از اطلاعات مختلف و متنوعی تشکیل شده و دارای قالبها و ساختارهای مختلفی میباشد و برای همین منظور استانداردهای تعریف و کنترل اطلاعات و انواع متادیتاها از سالها پیش مورد توجه بوده و در حال حاضر با افزایش حجم و نوع اطلاعات اهمیت بیشتری پیدا کرده و استانداردهای آن هر روز در حال توسعه و گسترش میباشد.
Dublin Core
عناصر اصلی Dublin Core در یک کارگاه آموزشی در دوبلین معرفی شد و هدف اولیه آن تعریف مجموعهای از عناصر بود که توسط نویسندگان برای توصیف کار و محصول خود استفاده شود که با تولید منابع الکترونیکی به کارگیری آن توسعه پیدا کرده و علاوه بر افزودن چند عنصر جدید یک سری قوانین نیز برای آن تعریف شد.
عناصر آن شامل عنوان، به وجود آورنده، موضوع، توصیف، ناشر، شریک، تاریخ، نوع، فرمت، شناسه، منبع، زبان، رابطه، پوشش و حق استفاده میباشد. Dublin Core با اینکه ساده و مختصر است ولی برای توصیف مستندات وبی و سایر مستندات استفاده میشود و تمام عناصر آن اختیاری بوده و قابل تکرار است و از هیچ ترتیب خاصی پیروی نمیکند.
تصویری از یک متادیتای Dublin core
MPEG-7
استاندارد MEG-7 ساختار، ارتباط و عناصر اصلی متادیتای مورد استفاده در منابع سمعی و بصری را تعریف میکند که شامل تصاویر، گرافیک، سه بعدی، موزیک، صدا، صحبت، ویدئو و یا مجموعههای چند رسانهای میشود. این استاندارد از چندین بخش تشکیل شده که شامل ابزارهای توصیفی، زبان تعریف توصیف و همچنین ابزارهای هماهنگی محتوا و متادیتا میباشد.
توصیف کننده منابع دیداری و شنیداری با استفاده از ساختار سلسله مراتبی اطلاعات یک منبع را توصیف میکنند و برای منابع بصری ساختار اصلی، رنگ، متن، شکل، حرکت، محلیت و اطلاعاتی از این قبیل توصیف میشود. برای منابع شنیداری توصیف در دو سطح عمومی و اختصاصی انجام میگیرد که در مشخصات عمومی ساختار و ویژگیها توصیف میشود و در مشخصات اختصاصی تجهیزات، موسیقی، نوع موسیقی، خواننده و از دست اطلاعات توصیف میشود.
ساختار توصیف بر اساس XML بنا شده که میتواند یک فایل متنی و قابل ویرایش، جستجو، قابل خواندن توسط انسان باشد و یک فایل کد شده که برای ذخیره یا انتقال مناسب میباشد. موتورهای جستجوی اینترنتی و استاندارد اطلاعات MPEG-7 را میتوانند بروز، جستجو و نمایش دهند. پشتیبانی از این استاندارد رو به گسترش است.
MPEG-21
MPEG-21 برای ایجاد یک بستر فراگیر برای تبادل منابع چند رسانهای دیجیتال توسعه داده شده و از چندین بخش تشکیل شده است. در بخشهای مختلف اطلاعاتی در مورد کلیات، تعریف منبع دیجیتال، شناسنامه آن، ویژگیهای مدیریتی، مقررات دسترسی و بازیابی و نحوه تطبیق آنها صحبت شده است.
اطلاعات یک فایل صدا در محیط نرم افزار تخصصی صدا
اطلاعات یک فایل تصویر که توسط ویندوز نشان داده می شود
خلاصه
در این نوشته سعی شد که یک نگاه نزدیکتری به موضوع و مفهوم متادیتا ارائه شود تا اهمیت تولید، نگهداری و استفاده از آنرا نشان دهد. با شناخت دقیقتر از متادیتا میتوان به دادههای مورد نظر خیلی سریعتر دسترسی پیدا کرده و مدیریت دادهها را اعم از چند رسانهای، متنی و یا کامپیوتری با کارآمدی بیشتری انجام داد.
اصطلاحات و تعاریف:
Metadata: "data about data"
Metacontent: "content about content"
Descriptive Metadata: "data about data contents"
Structural Metadata: "data about the containers of data"
XMP: Extensible Metadata Platform (an Adobe standard)
MPEG: Moving Picture Experts Group
Dublin Core elements: Title, Creator, Subject, Description, Publisher, Contributor, Date, Type, Format, Identifier, Source, Language, Relation, Coverage, and Rights