+98 21 66591625

متادیتا و آرشيو ديجيتال صدا

متادیتا و آرشيو ديجيتال صدا

 

 

متادیتا و آرشیو دیجیتال صدا

مجله صنعت صدا و تصویر، شماره سی و هشت، آذر و دی 90

محمدتقی فاتحی­ خواجه

این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

 

عضو هيئت علمی دانشگاه آزاد واحد تهران جنوب

مدير پروژه اتوماسيون راديو شرکت سامانه های عصر تمدن (ساعت)

 

 

 

کلمات کلیدی: فراداده، متادیتا، فایل صدا

چکیده

با توجه به پيشرفت روز افزون فناوری اطلاعات و تحولات ناشی از آن، استفاده از تجهيزات ديجيتال و سیستم­های كامپيوتري در عرصه­ ی رسانه­ های صوتی و تصویری در حال گسترش بوده و با توجه به عدم تولید و ارائه­ ی تجهیزات ذخیره سازی آنالوگ، تجهیزات مدرن و دیجیتال براي ارائه­ ي هر نوع اطلاعات و داده ­ها جایگزین تجهیزات سنتی و آنالوگ شده است. در سیستم­های دیجیتال، منابع صوتی و تصویری به صورت فایل­های کامپیوتری در حافظه­ های مغناطیسی، نوری و یا الکترونیکی ذخیره می­شود و از آنجائیکه مراجعه به محتوا و متن منابع رسانه ­ای توسط سیستم­های کامپیوتری پر هزینه و در برخی مواقع غیر ممکن است، برای دسترسی به منابع آرشیوی رسانه­ ای و در نهایت انتخاب منبع مورد نظر از اطلاعات جانبی و متا دیتای آنها استفاده می­شود. در اين نوشته با توجه خاص به منابع دیجیتال صوتی و روشهای پیاده سازی اطلاعات جانبی آنها در حوزه­ ی رسانه ­ای بحث شده و روش پنهان سازی متادیتا یا فراداده در فایل­های صوتی استاندارد مورد توجه خاص قرار گرفته است.

 

مقدمه

با ورود به دنيای ديجيتال، با توجه به ارزان شدن حافظه­ های کامپيوتری در حين افزايش گنجايش آنها و گسترس فرهنگ استفاده از سيستم­های کامپيوتری و همچنين براي استفاده از توانائیهای خاص سيستم­هاي ديجيتال مثل سرعت، انعطاف­پذيری، يکپارچگی، علاوه بر کاهش زمان دسترسی به منابع، موجب افزايش بهره وري، کاهش چشمگير هزينه ­ها، سرعت بخشيدن به توليد و انتقال اطلاعات و دانش شود. سرعت انتقال محتوا و افزایش تبادل منابع از ويژگی­هاي خاص سازمان­ها و مراکز رسانه ­ای امروز می­باشد.

برای حضور رسانه­ ای در فضای بوجود آمده­ ی حاصل از تغییرات تکنولوژی مستلزم تبدیل منابع صوتی و تصویری از رسانه­ های آنالوگ به رسانه های دیجیتال می­ باشد که در این راستا موضوعات و مسائلی مثل فرمت و ساختار فایل­های دیجیتال شده، رسانه ذخیره سازی و نحوه نگهداری آنها و مهمتر از همه چگونگی سازماندهی و دسترسی به منابع مطرح می­ شود که برای هر کدام از مسائل طرح شده، استانداردهای مختلف و متناسب با کاربری آنها توسط نهادها و سازمان­های مربوطه تعریف شده و یا می  شود.

برای دسترسی موثر و کارآمد به منابع و همچنین به منظور تبادل الکترونیکی منابع دیجیتال به اطلاعات توصیفی مناسبی احتیاج می­باشد. سازمان­های رسانه ­ای برای این منظور روش­های مختلفی برای همراه کردن متادیتا با منابع صوتی و تصویری معرفی کرده­اند و علی رغم ایجاد همگرایی نسبی ولی همچنان پراکندگی زیادی در نحوه­ ی ارائه ­ی اطلاعات وجود دارد که تبادل محتوا را به چالش می­کشاند. این موضوع زمانی شکل مشکل جدی به خود می­گیرد که تبادل محتوای رسانه ای کامپیوتری و خودکار مدنظر باشد.

دسترسی سريع و کارآمد به منابع از يك طرف و توزیع پذیر و قابل جابجا بودن منابع از طرف ديگر باعث شده كه مدیریت و سازماندهی اطلاعات جانبی و متادیتای منابع اهمیت زیادی داشته باشد. برای فراهم کردن شرایط تبادل محتوای رسانه­ای علاوه بر ایجاد بستر سخت افزاری، احتیاج به توصیف متادیتای جامع و مشترک برای منابع رسانه­ ای دیجیتال می­باشد و مهمتر از آن (و یا بعد از آن) تعریف روش استاندارد و مشترکی برای تلفیق و همراه کردن متادیتا با خود منابع می­باشد.

تعریف متادیتا در فایل­های صدای دیجیتال شده به طور کلی به چهار روش قابل پیاده سازی می باشد که عبارتند از استفاده از بانک اطلاعات، به کارگیری یک فایل توصیفی در کنار فایل صدا، استفاده از فیلدهای اطلاعاتی استاندارد موجود در فایل صدا و یا تعریف متادیتای توصیفی پنهان در فایل صدا می­باشد. در این نوشته پس از معرفی فایل­های صدای دیجیتال استاندارد بدون فشرده سازی و توضیح روشهای ارائه­ ی متادیتا، در مورد یک روش پیشنهادی پیاده سازی متادیتا با بررسی جوانب مختلف موضوع، بررسی بیشتر خواهد شد.

این پیشنهاد می­تواند پس از بررسی­های لازم و تغییرات احتمالی منجر به یک استاندارد درون سازمانی و یا برون سازمانی شود تا مشکل تبادل محتوا بین واحدها و سازمانها مرتفع گردد. در این صورت لازم نیست سیستم نرم­ افزاری واحدی در کلیه بخش­ها پیاده سازی شود بلکه با رعایت استاندارد متادیتای تعریف شده سیستمهای گسترده­ای می­توانند با هم تبادل محتوا داشته باشند.

 

 

ساختار فایل صدا

فايل­های صدای Wave زير مجموعه­ ی فرمت RIFF (Resource Interchange File Format) مايکروسافت براي ذخيره­ی فايلهاي چند رسانه­ای است. يک فايل RIFF با يک هدر شروع شده و داراي تعدادي چانک است. يک فايل Wave اغلب يک فايل RIFF است و دارای یک چانک Wave که شامل دو زير چانک فرمت (fmt) و داده (data) مي­باشد. چانک fmt فرمت داده­های فایل صدا را مشخص مي­کند و چانک data شامل داده­هاي مربوط به صدا مي­باشد.

ساختار فایل­های صدا طبق فرمت استاندارد Wave که در شکل یک نشان داده شده است، دارای یک چانک “RIFF” برای توصیف کل فایل و دارای یک زیر چانک “fmt ” برای توصیف فرمت اطلاعات صوتي فایل و دارای یک زیر چانک “data” که شامل اطلاعات صوتي فایل می­باشد. به عبارت دیگر کل فایل صدا یک چانک می­باشد که دارای زیر چانک­های متعدد می­باشد و داده­های مربوط به صدا خود نیز یک زیر چانک می­باشد.

 

شکل یک: ساختار یک فایل صدای Wave

 

در ساختار فایل wave هر زیر چانک دیگری را که منطبق با استاندارد فایل صدا باشد می توان تعریف کرد ولی استاندارد مورد حمایت سازمان های جهانی نخواهد بود. طول و محتوای زیر چانک ها که مشابه خود چانک می باشد محدودیت نداشته و فقط محدود به گنجایش کل فایل صدا می باشد که حداکثر 4 گیگا بایت خواهد بود.
چانک های غیر معروف و ناشناخته در زمان بازسازی مجدد و یا تغییرات محتوای فایل صدا از بین می روند مگر اینکه ابزار ویرایشی مورد استفاده آنرا پشتیبانی کند. در زمان خواندن فایل های صدا چانک های اضافه هیچ مانعی برای پخش آنها ایجاد نخواهد کرد و با پخش فایل صدا دستخوش تغییر نیز نخواهند شد.
فرمت (BWF (Broadcast Wave Format همان فرمت فایل های wave می باشد که دارای یک زیر چانک با عنوان (bext (Broadcast EXTension می باشد. در این زیر چانک، اطلاعات شناسنامه ای و مالکیتی از فایل صدا ذخیره می شود که محدود به چند فیلد زمان ایجاد، ایجاد کننده، توصیف و تاریخچه ی فایل صدا می باشد.


متادیتای فایل های صدا
هر نوع اطلاعات از قبيل فايل هاي متني، شنيداري، ديداري و گرافيکي که غالباً بر مبناي رمز باينري يا رمزهاي ديگر و متشکل از سطوح صفر و يک يا در قالب ها و استانداردهاي نظير آن به صورت فایل بيان مي شود، داده (Data) گفته می شود و به هرگونه اطلاعات متني تشريحي، تکميل کننده و يا تغيير دهنده انواع داده در فرآيند توليد و پخش، فراداده یا متادیتا (Meta Data) می گويند. به بياني ديگر متاديتا عبارت است از تمام يا بخشي از داده يا اطلاعات مربوط به داده اصلي به طوريکه توصيف کننده ی آن می باشد. اين اطلاعات مي تواند شامل اطلاعات فني، توصيفي ، تحليلي و وضعيتي در مورد داده ها باشد.
مي توان محتواي متاديتا را به دو بخش اصلي تقسيم کرد. بخش اول مربوط به شناسنامه ی فايل است و شامل اطلاعاتي چون نام فايل، نوع منبع، تهيه کننده و از این قبیل اطلاعات مي باشد که بدون آن يک فايل صوتي بدون هويت و غير قابل شناخت است و بخش دوم که دائم در حال تغيير است و به عبارتي در نرم افزارها موجب هدايت فايل در مسير فرآيند کاري مي گردد و شامل مجوزها و علامتهاي کنترلي همچون مجوز پخش، تاريخ و ساعت پخش، تعداد دفعات پخش و یا محدودیت های آن می باشد.
صدای ديجيتال يک فايل صوتی است که به همراه اطلاعات جانبی ديگر در يک فايل با پسوند WAV طبق شکل دو ذخيره می شود. اين فايل دارای چندين چانک (Chunk) اطلاعاتی می باشد که به عنوان مثال چانک fmt-ck مربوط به اطلاعات فرمت فايل و چانک wave-data مربوط به اطلاعات صدای آن می باشد. چانک های دیگر و با کاربری های مختلف در ساختار فایل صدای Wave قابل تعریف و استفاده است.

 

شکل دو: ساختار فايل صدای Wave

 

با توجه به مطالب فوق محتوي اطلاعات از نوع اول شناسنامه اصلي فايل بوده و معمولاً در بانکهاي اطلاعاتي در جدول آرشيو نگهداري و مورد استفاده قرار مي گيرند و همينطور اطلاعات از نوع دوم در صفحات نرم افزار ديده شده و عموماً فايل صوتي به آن متصل مي گردد. بانک اطلاعاتي نيز با توجه به نوع طراحي سیستم نرم افزاری مي تواند از جدول جداگانه اي بهره بگيرد.


روش های پیاده سازی متادیتا
اطلاعات جانبی مربوط به يک فايل صدا به شکل های مختلفی قابل ذخيره کردن و استفاده می باشد که شامل عنوان، شرح، سرعنوان‌هاي موضوعي، کلمات کليدي، منبع، تاريخ توليد، زبان، مخاطب، مناسبت، کيفيت، حالت صدا و غيره می باشد. روش های مختلف مورد نظر از نظر نحوه ذخيره سازی اطلاعات، تعداد و تنوع فيلدهای اطلاعاتی، سرعت دسترسی به آنها و روش ارتباط با فايل صدای مربوطه متفاوت بوده و متناسب با کاربری مورد نظر انتخاب و پياده سازی می گردد.
اطلاعات BWF : تعدادی فيلد اطلاعاتی مشخص و با قالب استاندارد که توسط نرم افزارهای حرفه ای صدا نيز پشتيبانی می شود در يک chunk با عنوان (bext (broadcast-audio-extension در خود فايل صدا نوشته می شود که اين اطلاعات استاندارد بوده ولی محدود به 5 فيلد اطلاعاتی طبق جدول یک می باشد. در اين روش، اطلاعات فايل صدا توسط ابزارهای استاندارد صدا قابل ديدن و ويرايش می باشد.

 

جدول یک: فيلدهای اطلاعاتی BWF

 

رديف

توضيح

فيلد

1

عنوان و توصيف صدا

Description

2

نام توليد کننده­ ی صدا

Originator

3

کد که توسط توليد کننده ­ی صدا مشخص می­شود

Reference

4

تاريخ و ساعت ايجاد فايل صدا

Date and time

5

سابقه­ ی کارهای انجام شده در مورد

Coding history

 

 

اطلاعات پنهان شده در فايل صدا : نگهداری و افزودن اطلاعات جانبی به صدا می تواند به صورت يک Chunk در داخل فايل صدا باشد. اين اطلاعات از ديد نرم افزارهای استاندارد صدا پنهان بوده و با وجود اينکه قالب استانداردی دارد ولی در صورت ويرايش فايل صدا، از دست می رود. اين روش در صورتيکه فايل های صدا، آرشيوی بوده و قابل ويرايش نباشند و از نرم افزارهای اختصاصی برای دسترسی به آنها استفاده شود، روش مناسبی برای ذخيره ی تعداد فيلدهای اطلاعاتی بيشتر (مورد نياز) و اختصاصی خواهد بود.
اطلاعات فايل XML : روش ديگر برای ذخيره ی اطلاعات مربوط به يک صدا استفاده از فايل اطلاعاتی جانبی می باشد که در اين صورت تعداد و تنوع اطلاعات جانبی صدا هيچگونه محدوديتی نداشته و فايل اطلاعاتی صدا، مستقل از خود فايل صدا قابل استفاده و ويرايش خواهد بود. در اين روش تضمينی برای هماهنگ بودن اطلاعات فايل صدا و خود فايل صدا وجود ندارد مگر اينکه هر دو فايل (صدا و اطلاعات) به روش مناسبی کدگزاری و به هم مرتبط شده باشند.
بانک اطلاعات: در سيستم های کامپيوتری و اتوماسيون آرشيو برای نگهداری اطلاعات جانبی يک فايل صوتی از بانک اطلاعاتی استفاده می شود. اين روش برای جستجو و دسترسی سريع به منابع آرشيوی مشخص خيلی مناسب می باشد ولی مستلزم پياده سازی يک سيستم نرم افزاری خاص بوده و به سادگی قابل حمل و جابجايی از يک سيستم به سيستم ديگر نخواهد بود. برای هر مرکز آرشيوی داشتن يک بانک اطلاعات برای مديريت منابع آرشيوی موجود ضروری می باشد ولی ميزان ارتباط اطلاعات فايل با خود فايل صدا و تنوع اطلاعاتی آن بستگی به سيستم نرم افزاری پياده سازی شده دارد.


چانک <AXML>
چانک AXML که توسط سازمان EBU تعريف شده است يک تعريف استاندارد از انواع محتواي داده براي يک فايل BWF به همراه XML را ارائه مي دهد. چانک <AXML> براي ذخيره و انتقال metadata بصورت XML بکار مي رود. چانک <AXML> ممکن است شامل هر داده با فرمت XML 1.0 يا قديمي تر از آن باشد و می تواند شاملXML هايي فراتر از يک الگوی استاندارد باشد .اين چانک شامل يک header همراه با يکسري داده با فرمت XML و با طول متفاوت می باشد.
محتواي چانک <AXML> مثل یک چانک استاندارد شامل اطلاعات کلی ckID (عنوان چانک)، ckSize (اندازه چانک) و xmlData (متادیتای مورد نظر) می باشد. ckID شامل 4 کاراکتر ‘a’، ‘x’ ، ‘m’ و ‘l’ براي تعريف چانک مي¬باشد. ckSize اندازه بخش داده چانک را مشخص مي کند و xmlData اين فيلد شامل اطلاعات متني xml مي باشد .
ساختار داده XML بطور پشت سر هم و بصورت رشته متني مطابق با استاندارد XML 1.0 و يا قديمي تر از آن ذخيره مي شود و در صورتیکه نرم افزار مقصد نتواند محتواي چانک <AXML> را با مشخصاتي که در XML وجود دارد تفسير کند کل چانک را ناديده گرفته مي گیرد.

بررسی و مقایسه ی روشها
با توجه به روش های اشاره شده برای نگهداری اطلاعات مربوط به فايل صدا و با توجه به تنوع کاربرد فايل های صدا، هر سيستمی که بتواند از روش های بيشتری برای نگهداری اطلاعات صدا استفاده کند، مي تواند کاربرد گسترده تر و موفقيت بيشتری داشته باشد، مگر اينکه سيستم برای کاربرد مشخص و محدودی طراحی شده باشد. ويژگی های روش های فوق در مقايسه با هم در جدول دو به صورت خلاصه بيان شده است و يک سيستم مي تواند با پياده سازی روش های مختلف از انعطاف و توانايي بيشتری برخوردار باشد.

 

جدول دو: مقايسه ­ی روش­های ذخيره سازی اطلاعات فايل صدا

 

 

BWF Chunk

AXML Chunk

XML file

Data Base

استاندارد

EBU

WAVE

خاص هر سازمان

خاص نرم ­افزار

سرعت دسترسی

دسترسی به متن فايل صدا

دسترسی به متن فايل صدا

دسترسی به يک فايل کوچک

خيلی سريع

ابزار دسترسی

ابزارهای حرفه­اي

خاص

متنوع

نرم ­افزار خاص

انعطاف در تغيير

با ابزارهای استاندارد صدا

با ابزار خاص

کاملاً منعطف

نرم ­افزار خاص

جابجایی

به همراه فایل صدا

به همراه فایل صدا

مستقل از فایل صدا

غیر قابل جابجایی

پايداری

برای ابزارهای خاص

فقط برای خواندن از فايل

به اندازه وجود فايل

مطمئن

مناسب برای

استاندارد جهانی

نگهداری مطمئن

 جابجایی

دسترسی سریع

 

در صورت استفاده از روش BWF علاوه بر اینکه متادیتا به همراه فایل صدا خواهد بود، یک قالب و فرمت استاندارد و مطمئن برای متادیتا تعریف خواهد شد ولی تعداد فیلدهای آن محدود و مشخص می­باشد. کاربرد این روش صرفاً برای معرفی مالکیت فایل صدا مناسب می­باشد.

روش بانک اطلاعاتی برای سیستم­های نرم­ افزاری صدای مستقر در یک سازمان برای دسترسی سریع به منابع آرشیوی مناسب بوده و دارای قابلیت انتقال کمتری بوده و به سادگی قابل ویرایش، تغییر و کاهش یا افزایش می­باشد. استفاده از این روش در هر سیستم آرشیوی لازم می­باشد.

روش استفاده از فایل XML در کنار فایل صدا علاوه بر انعطاف در تنوع اطلاعات در متادیتا ولی از قابلیت اطمینان کمتری برخوردار خواهد بود. این روش صرفاً برای جابجایی منابع آرشیوی خیلی مناسب خواهد بود.

استفاده از AXML می­تواند قابلیت اطمینان و پایداری را در نگهداری متادیتا افزایش داده و برای جابجایی منابع روش مناسبی باشد. این روش می­تواند برای سازمان­های گسترده به عنوان یک استاندارد داخلی بوده و تبادل داده ­ها را در محدوده ­ی سازمان بین واحدها روان و مطمئن و کم هزینه بکند.

 

نتيجه ­گیری

در صورت پياده سازي متاديتاي نهان شده در فايل صدا به صورت AXML در سازمانهای بزرگ، لزوم استفاده از يک نرم افزار واحد در همه واحد ها کم رنگ شده و کافيست تنها يک متاديتاي کامل و واحد که تمام نيازهاي همه واحدها را در برمي گيرد تعريف گردد. در اين صورت مي توان از  همه  توليد کنندگان نرم افزار با رعايت الگوي مصوب متاديتا بهره جست. که اين الگو با توجه به تنوع نيازها، در حال حاضر راهگشا بوده و مي تواند تبادل اطلاعات بين واحدهای مختلف را ساده، روان و مطمئن سازد. برای اين منظور بايد همه متاديتای موجود و همچنين فرامين و مجوزهاي کنترلي در قالب AXML به همراه فايل و نهان در فايل بارگذاري شود. 


  ديجيتال سازی، متاديتا , آرشیو دیجیتال صدا , فرداده , فایل صدا , رسانه دیجیتال , wave , چانک
  30  دی  1398 ,   مقالات

نظرات (0)

هنوز نظری ارسال نشده است

دیدگاه خود را بیان کنید

  1. بهتر است نام و نظر خود را فارسی تایپ کنید ( برای انتشار سریع نظر یا افزودن فایل پیوست، باید وارد حساب کاربری خود شوید ) عضویت یا ورود به حساب کاربری.
پیوست (0 / 3)
انتشار موقعیت
 
تماس با ما
 
آدرس: تهران، میدان توحید، خیابان نصرت غربی، کوچه حسینی، پلاک 6 (کد پستی 1457863991)
...........................................................
تلفن(خط4): 66591625 21 98+ 
...........................................................
فکس(خط4): 66591625 21 98+
...........................................................