كل ساعة مقال

سجل بريدك للحصول على مقالات تناسبك

تعدين النصوص بسهولة أكبر

تبدو مبادرة نشر جاهزة لتبسيط النصوص.

تعدين البيانات وتعدين النصوص

لسنوات عديدة، حلم تيم بيرنرز لي، مخترع الشبكة العنكبوتية العالمية، بأن تكون الآلات قادرة على مساعدة البشر في استخدام ابتكاره. وهذا سيمكن لأدوات البحث المتطورة لاستخراج الكلمات أو العبارات فحسب، ولكن أيضًا لمحركات أخرى للبحث عن المعاني والأنماط. تم تجميع هذا “الويب الدلالي” تدريجيًا. والخطوة الأخيرة تقرب مستخدمي الأدب العلمي من تحقيق هذا الحلم من خلال تعزيز وصول الكمبيوتر إلى النص الكامل للأدب العلمي.

تعدين النصوص في العلوم الحياتية

لقد بدأ بعض الباحثين في استخدام تعدين النصوص. على سبيل المثال، قام علماء الأحياء بتطوير برمجيات تستكشف “قواعد النصوص” المفتوحة، وخاصة قاعدة بيانات ببميد. يمسحون العديد من النشرات لاكتشاف العلاقات القائمة على العبارات أو الجمل التي، عند تحليلها معًا، تربط بين كائن واحد (مثل مرض) وآخر (مثل جزيء). في جامعة كاليفورنيا، بيركلي، يتم استخدام مشروع BioText لاستكشاف البروتابتوز، على سبيل المثال (http://biotext.berkeley.edu). في جامعة إلينوي في شيكاغو، يستكشف برنامج Arrowsmith أسباب المرض (http://arrowsmith.psych.uic.edu/arrowsmith_uic/index.html). وفي معهد البيوإنفورماتيك الأوروبي بالقرب من كامبريدج في المملكة المتحدة، يستكشف محرك البحث EBIMed تفاعلات البروتين-بروتين (http://www.ebi.ac.uk/Rebholz-srv/ebimed/index.jsp).

معايير تعليق النصوص

ولكن لم يطور الناشرون بعد معيارًا موحدًا لتعليق محتواهم يسمح للكمبيوتر بالوصول إلى النص الكامل. في وقت سابق من هذا الشهر، أطلقت مجموعة Nature Publishing مقترحًا أوليًا لهذا المعيار. ليس المقترح منتجًا تجاريًا بل خدمة محتملة للمجتمع. وهو مفتوح للتعليق ولا يهدف إلى توفير ميزة تنافسية لنا: بل على العكس، فإنه سينجح فقط إذا تم اعتماده من قبل الناشرين الآخرين.

واجهة تعدين النصوص المفتوحة

المقترح هو واجهة تعدين النصوص المفتوحة (OTMI)، التي تم تقديمها لأول مرة في مؤتمر ومعرض العلوم الحياتية في بوسطن في وقت سابق من هذا الشهر. يمكن العثور على وصف وأمثلة على http://blogs.nature.com/wp/nascent/2006/04/open_text_mining_interface_1.html. ستجعل المقترح النص المشفر متاحًا مجانًا للجميع. إذا اعتمد جميع الناشرون هذا المعيار أو معيارًا مشابهًا، ستصبح الأدب بأكمله قابلًا للوصول للتعدين.

موديلات الأعمال وتعدين النصوص

كيف يتعلق هذا المقترح بنماذج الأعمال المختلفة للناشرين؟ ستتمكن الناشرين الذين يدفعون المؤلفين من استخدام هذا النهج لقراءة الآلة ومساعدة المستخدمين في العثور على محتواهم بسهولة أكبر. ستتبع الناشرين الذين يدفعون المشتركين مجموعة Nature Publishing في جعل هذا الإصدار من النص الكامل قابلًا للاستكشاف بواسطة الآلات ولكن غير قابل للقراءة بواسطة البشر. (سيجعل فرض على الوصول إلى الآلة عبر جدران الناشرين المتنوعة تعدين النصوص بالآلة مستحيلاً.) يتمثل نهج OTMI في تشفير الجمل واختلاطها، مع الاحتفاظ بال الدلالية قدر الإمكان.

سيشير النقاد إلى أن هذا يحد من قدرة الآلة على القراءة أيضًا؛ على سبيل المثال، يصبح البحث عن القرب غير ممكن. ولكن نموذج الدفع من قبل المشتركين مدعوم بشدة في السوق. يمثل OTMI حلاً محتملاً بين احتياجات الأعمال والوصول المفتوح. ترحب Nature وناشروها بالتعليقات حول هذه المبادرة، والتي يجب إرسالها إما إلى [email protected] أو إلى المدونة المذكورة أعلاه.

والأذونات

إعادة ع والأذونات

حول هذه المقالة

استشهاد هذه المقالة

Machine readability. Nature 440، 1090 (2006). https://doi.org/10.1038/4401090a

تنزيل الاقتباس

تاريخ النشر: 26 أبريل 2006

تاريخ العدد: 27 أبريل 2006

DOI: https://doi.org/10.1038/4401090a

شارك هذه المقالة

أي شخص تشارك معه الرابط التالي سيتمكن من قراءة هذا المحتوى: احصل على رابط قابل للمشاركة

عذرًا، الرابط القابل للمشاركة غير متاح حاليًا لهذه المقالة.

نسخ إلى الحافظة

مقدم من مبادرة مشاركة المحتوى SharedIt من Springer Nature

تنزيل الاقتباس

إعلان

استكشاف المحتوى

مقالات البحث

رأي

البحوث

ال

الكتب والثقافة

البودكاست

مقاطع الفيديو

العدد الحالي

تصفح العدد

المجموعات

المواضيع

تابعنا على

تابعنا على تويتر

اشترك في التنبيهات

تغذية RSS

حول المجلة

فريق التحرير

نشر معنا

سجل للحصول على التنبيهات

تنزيل PDF

إعلان

استكشاف المحتوى

مقالات البحث

أخبار

رأي

تحليل البحوث

ال

الكتب والثقافة

البودكاست

مقاطع الفيديو

العدد الحالي

تصفح العدد

المجموعات

المواضيع

تابعنا على فيسبوك

تابعنا على تويتر

اشترك في التنبيهات

تغذية RSS

حول المجلة

فريق التحرير

حول المحررين

معلومات المجلة

نماذج النشر لدينا

بيان القيم التحريرية

مقاييس المجلة

الجوائز

اتصل بنا

سياسات التحرير

تاريخ نيتشر

أرسل تلميحًا للأخبار

اشترك معنا

للكتّاب

للمراجعين

خدمات تحرير اللغة

تقديم المخطوطة

بحث

البحث في المقالات حسب الموضوع أو الكلمة الرئيسية أو الكاتب

عرض النتائج من

جميع المجلات

هذه المجلة

بحث

بحث متقدم

روابط سريعة

استكشاف المقالات حسب الموضوع

العثور على وظيفة

دليل المؤلفين

سياسات التحرير

Nature (Nature)

ISSN 1476-4687 (عبر الإنترنت)

ISSN 0028-0836 (طباعة)

sitemap nature.com

حول مجموعة نيتشر

حولنا

البيانات الصحفية

مكتب الصحافة

اتصل بنا

اكتشف المحتوى

المجلات A-Z

المقالات حسب الموضوع

تبادل البروتوكولات

مؤشر نيتشر

سياسات النشر

سياسات مجموعة نيتشر

الوصول المفتوح

خدمات الكاتب والباحث

إعادة الطبع والأذونات

بيانات البحث

تحرير اللغة

تحرير العلوم

دروس ماجستير نيتشر

حلول البحث

مكتبات ومؤسسات

خدمة وأدوات المكتبيين

بوابة المكتبي

البحث المفتوح

التوصية بالمكتبة

الإعلان والشراكات

الإعلان

الشراكات والخدمات

أدوات الإعلام

مجموعات التطوير المهني

وظائف نيتشر

نيتشر كيريرز

مؤتمرات نيتشر

مواقع إقليمية

نيتشر أفريقيا

نيتشر الصين

نيتشر

نيتشر

نيتشر اليابان

نيتشر كوريا

نيتشر الشرق الأوسط

الخصوصية

سياسة الخصوصية

استخدام ملفات تعريف الارتباط

اختيارات الخصوصية/إدارة ملفات تعريف الارتباط

إشعار ي

بيان الوصول

البيانات الشخصية للولايات المتحدة

© 2024 Springer Nature Limited

إغلاق اللافتة

اشترك في نشرة Nature Briefing – ما يهم في العلوم، مجانًا في صندوق البريد الوارد الخاص بك يوميًا.

عنوان البريد الإلكتروني

اشترك

أوافق على معالجة معلوماتي وفقًا لسياسة الخصوصية لشركة نيتشر وشركة Springer Nature Limited.

إغلاق اللافتة

احصل على أهم قصص العلوم في اليوم، مجانًا في صندوق البريد الوارد الخاص بك. اشترك في نشرة Nature Briefing

Source: https://www.nature.com/articles/4401090a


Posted

in

by

Comments

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *