در نمایهسازی مراحل زیر باید در نظر گرفته شود:
- کنترل اصطلاحات تخصصی
- تعیین توصیفگرها
- هماهنگی و تناسب توصیفگرها
تعیین توصیفگرها با کمک اصطلاحنامه (Thesaurus) انجام می پذیرد.
اصطلاحنامه برای کنترل واژهها به منظور برگرداندن زبان طبیعی مدارک به زبان مقید استفاده می شود و مجموعه اصطلاحات تخصصی مربوط به یک علم است و میان آن اصطلاحات روابط معنایی، ردهای، و سلسله مراتبی برقرار شده
اصطلاحنامه می تواند موضوع یک علم را با همه جنبههای اصلی و فرعی و وابسته، بهگونهای نظامیافته و برای ذخیره و بازیابی اطلاعات ارائه دهد.
اصطلاحنامه در هنگام ذخیره سازی اطلاعات و برای بازیابی اطلاعات استفاده می شود.
در هنگام ذخیره سازی در نمایه سازی ماشینی پس از آنکه اصطلاحنامه به بانک اطلاعاتی لینک داده شد پس از مقایسه، کلمات مشترک بین آنها بعنوان کلید واژه انتخاب می شود.
در هنگام بازیابی اطلاعات ، اصطلاحنامه به بانک اطلاعاتی لینک داده می شود و کاربر پس از انتخاب یک اصطلاح خاص از اصطلاحنامه ، درخواست می دهد آن اصطلاح در پایگاه اطلاعاتی جستجو شود
به طور نسبی اصطلاحنامهها ابزاری هستند برای انتخاب در بازیابی متن آزاد. در اصطلاحنامه اصطلاحات معنای خود را در زبان عامیانه از دست میدهند و در چارچوب ارتباط محدود سیستمهای زبانی قرار میگیرند. اصطلاح نامه در نمایه سازی دستی استفاده میشود و میتواند برای تحلیل محتوای مدارک به صورت ماشینی نیز مورد استفاده قرار گیرد.
مزیت استفاده از اصطلاحنامه (Thesaurus)
مزیت استفاده از اصطلاحنامه آن است که عمق نمایه سازی هنگام تولید واژگان نمایه سازی مشخص میشود و یک وحدت معنایی در هنگام بازیابی اطلاعات و نمایه سازی حاصل میشود.
مشخصات اصطلاحنامه (Thesaurus)
- برقراری ارتباط بین اصطلاحات
- حوزه اعتبار هر اصطلاحنامه مشخص میکند چه واحدهای مفهومی در دسترس قرار دارند و توسط چه ارتباطاتی ارائه میشوند.
- اصطلاحاتی که در اصطلاحنامه وجود دارند و توسط نمایهسازان مورد استفاده قرار میگیرند توصیفگر (اصطلاح مرجح) نامیده میشوند.
اصطلاحاتی که در اصطلاحنامه وجود دارند و نباید توسط نمایه سازان مورد استفاده قرار گیرند، اصطلاح نامرجح نامیده میشوند
نمونه فهرست کلیدواژگان
ردیف | کلمات موجود در متن | اصطلاحات در اصطلاحنامه (تزاروس) | کلیدواژه نهایی | شماره صفحه |
۱ | کشت | رشد دادن -رشد – کشت بافت | کشت | ۱ |
۲ | کامبوجا | ……. | کامبوجا | ۱ |
۳ | ویتامین | ویتامین – کمبود ویتامین | ویتامین | ۲ |
۴ | درمانی | درمان- بهبود- خوب شدن | درمان | ۳ |
۵ | دیابت | مرض قند- انسلین – قند پایین | مرض قند ، دیابت | ۳ |
۶ | اختلالات | اختلالات بینایی -مشکلات مزاجی | اختلال | ۴ |
۷ | اسانس | طمع دهنده- مزه – اساره | طمع دهنده | ۴ |
۸ | همزیستی | زیستن – مصالحه – سازگار شدن | همزیستی | ۶ |
۹ | مضر | ناخوشایند – آسیب رسان – ضرر دهنده | آسیب رسان | ۷ |
۱۰ | عوارض | عارضه- اختلال- رویداد نامطلوب | عارضه | ۸ |
مشاهده فیلم آموزشی نحوه انجام مراحل پروژه نمایه سازی
مشاهده ویدیوی آموزشی روش استفاده از اصطلاحنامه ایرانداک
طراحی نرم افزار اصطلاحنامه Thesaurus Software
معمولاً اصطلاحنامهها به دو روش تدوین میگردند. روش اول شکلدهی اصطلاحنامهای به یک توده از واژههای یک حوزۀ تخصصی است، این روش پیشتر در ترجمۀ اصطلاحنامه از زبانی به زبان دیگر متداول است. روش دوم تدوین یک ساختار اصطلاحنامهای پایه در یک یا چند حوزۀ تخصصی و بعد اضافه نمودنِ واژههای مرتبط در هر یک از شاخهها و زیر شاخههای مربوط به این ساختار پایه و بسط و توسعه آن است. متخصصان اطلاعرسانی و اصطلاحشناسان روش دوم را عملیتر و کاربردیتر از روش اول میشناسند.
برای طراحی نرم افزار اصطلاحنامه باید بر اساس ساختار درختی ترسیم شده، توسط یکی از متخصصان برنامهنویسی نرمافزاری طراحی گردد که بتوان ساختار درختی را به عنوان ورودی به آن وارد نمود و ساختارهای متفاوت اصطلاحنامهای را به صورت خروجی از آن دریافت کرد. ضمن این که هنگام ورود اطلاعات نیز میتوان ساختار درختی را به شکل ترسیمی به روی نمایشگر مشاهده نمود. با وجود این نرم افزار، دیگر نیازی به تبدیل ساختار درختی به ساختار خطی بر روی کاغذ وجود ندارد، بلکه میتوان ساختار درختی ( خورشیدی ) را مستقیماً وارد نرمافزار نمود
برای مطالعه بیشتر لطفا به کتاب نمایه سازی ماشینی مراجعه فرمایید
کتاب نمایه سازی ماشینی
گردآورنده : شهرزاد نیاکان
دیدگاهتان را بنویسید