تبدو مبادرة نشر جاهزة لتبسيط تعدين النصوص.
تعدين البيانات وتعدين النصوص
لسنوات عديدة، حلم تيم بيرنرز لي، مخترع الشبكة العنكبوتية العالمية، بأن تكون الآلات قادرة على مساعدة البشر في استخدام ابتكاره. وهذا سيمكن لأدوات البحث المتطورة لاستخراج الكلمات أو العبارات فحسب، ولكن أيضًا لمحركات أخرى للبحث عن المعاني والأنماط. تم تجميع هذا “الويب الدلالي” تدريجيًا. والخطوة الأخيرة تقرب مستخدمي الأدب العلمي من تحقيق هذا الحلم من خلال تعزيز وصول الكمبيوتر إلى النص الكامل للأدب العلمي.
تعدين النصوص في العلوم الحياتية
لقد بدأ بعض الباحثين في استخدام تعدين النصوص. على سبيل المثال، قام علماء الأحياء بتطوير برمجيات تستكشف “قواعد النصوص” المفتوحة، وخاصة قاعدة بيانات ببميد. يمسحون العديد من النشرات لاكتشاف العلاقات القائمة على العبارات أو الجمل التي، عند تحليلها معًا، تربط بين كائن واحد (مثل مرض) وآخر (مثل جزيء). في جامعة كاليفورنيا، بيركلي، يتم استخدام مشروع BioText لاستكشاف البروتابتوز، على سبيل المثال (http://biotext.berkeley.edu). في جامعة إلينوي في شيكاغو، يستكشف برنامج Arrowsmith أسباب المرض (http://arrowsmith.psych.uic.edu/arrowsmith_uic/index.html). وفي معهد البيوإنفورماتيك الأوروبي بالقرب من كامبريدج في المملكة المتحدة، يستكشف محرك البحث EBIMed تفاعلات البروتين-بروتين (http://www.ebi.ac.uk/Rebholz-srv/ebimed/index.jsp).
معايير تعليق النصوص
ولكن لم يطور الناشرون بعد معيارًا موحدًا لتعليق محتواهم يسمح للكمبيوتر بالوصول إلى النص الكامل. في وقت سابق من هذا الشهر، أطلقت مجموعة Nature Publishing مقترحًا أوليًا لهذا المعيار. ليس المقترح منتجًا تجاريًا بل خدمة محتملة للمجتمع. وهو مفتوح للتعليق ولا يهدف إلى توفير ميزة تنافسية لنا: بل على العكس، فإنه سينجح فقط إذا تم اعتماده من قبل الناشرين الآخرين.
واجهة تعدين النصوص المفتوحة
المقترح هو واجهة تعدين النصوص المفتوحة (OTMI)، التي تم تقديمها لأول مرة في مؤتمر ومعرض العلوم الحياتية في بوسطن في وقت سابق من هذا الشهر. يمكن العثور على وصف وأمثلة على http://blogs.nature.com/wp/nascent/2006/04/open_text_mining_interface_1.html. ستجعل المقترح النص المشفر متاحًا مجانًا للجميع. إذا اعتمد جميع الناشرون هذا المعيار أو معيارًا مشابهًا، ستصبح الأدب بأكمله قابلًا للوصول للتعدين.
موديلات الأعمال وتعدين النصوص
كيف يتعلق هذا المقترح بنماذج الأعمال المختلفة للناشرين؟ ستتمكن الناشرين الذين يدفعون المؤلفين من استخدام هذا النهج لقراءة الآلة ومساعدة المستخدمين في العثور على محتواهم بسهولة أكبر. ستتبع الناشرين الذين يدفعون المشتركين مجموعة Nature Publishing في جعل هذا الإصدار من النص الكامل قابلًا للاستكشاف بواسطة الآلات ولكن غير قابل للقراءة بواسطة البشر. (سيجعل فرض رسوم على الوصول إلى الآلة عبر جدران الناشرين المتنوعة تعدين النصوص بالآلة مستحيلاً.) يتمثل نهج OTMI في تشفير الجمل واختلاطها، مع الاحتفاظ بالعلاقات الدلالية قدر الإمكان.
سيشير النقاد إلى أن هذا يحد من قدرة الآلة على القراءة أيضًا؛ على سبيل المثال، يصبح البحث عن القرب غير ممكن. ولكن نموذج الدفع من قبل المشتركين مدعوم بشدة في السوق. يمثل OTMI حلاً محتملاً بين احتياجات الأعمال والوصول المفتوح. ترحب Nature وناشروها بالتعليقات حول هذه المبادرة، والتي يجب إرسالها إما إلى [email protected] أو إلى المدونة المذكورة أعلاه.
حقوق النشر والأذونات
إعادة الطبع والأذونات
حول هذه المقالة
استشهاد هذه المقالة
Machine readability. Nature 440، 1090 (2006). https://doi.org/10.1038/4401090a
تنزيل الاقتباس
تاريخ النشر: 26 أبريل 2006
تاريخ العدد: 27 أبريل 2006
DOI: https://doi.org/10.1038/4401090a
شارك هذه المقالة
أي شخص تشارك معه الرابط التالي سيتمكن من قراءة هذا المحتوى: احصل على رابط قابل للمشاركة
عذرًا، الرابط القابل للمشاركة غير متاح حاليًا لهذه المقالة.
نسخ إلى الحافظة
مقدم من مبادرة مشاركة المحتوى SharedIt من Springer Nature
تنزيل الاقتباس
إعلان
استكشاف المحتوى
مقالات البحث
أخبار
رأي
تحليل البحوث
الوظائف
الكتب والثقافة
البودكاست
مقاطع الفيديو
العدد الحالي
تصفح العدد
المجموعات
المواضيع
تابعنا على فيسبوك
تابعنا على تويتر
اشترك في التنبيهات
تغذية RSS
حول المجلة
فريق التحرير
نشر معنا
سجل للحصول على التنبيهات
تنزيل PDF
إعلان
استكشاف المحتوى
مقالات البحث
أخبار
رأي
تحليل البحوث
الوظائف
الكتب والثقافة
البودكاست
مقاطع الفيديو
العدد الحالي
تصفح العدد
المجموعات
المواضيع
تابعنا على فيسبوك
تابعنا على تويتر
اشترك في التنبيهات
تغذية RSS
حول المجلة
فريق التحرير
حول المحررين
معلومات المجلة
نماذج النشر لدينا
بيان القيم التحريرية
مقاييس المجلة
الجوائز
اتصل بنا
سياسات التحرير
تاريخ نيتشر
أرسل تلميحًا للأخبار
اشترك معنا
للكتّاب
للمراجعين
خدمات تحرير اللغة
تقديم المخطوطة
بحث
البحث في المقالات حسب الموضوع أو الكلمة الرئيسية أو الكاتب
عرض النتائج من
جميع المجلات
هذه المجلة
بحث
بحث متقدم
روابط سريعة
استكشاف المقالات حسب الموضوع
العثور على وظيفة
دليل المؤلفين
سياسات التحرير
Nature (Nature)
ISSN 1476-4687 (عبر الإنترنت)
ISSN 0028-0836 (طباعة)
sitemap nature.com
حول مجموعة نيتشر
حولنا
البيانات الصحفية
مكتب الصحافة
اتصل بنا
اكتشف المحتوى
المجلات A-Z
المقالات حسب الموضوع
تبادل البروتوكولات
مؤشر نيتشر
سياسات النشر
سياسات مجموعة نيتشر
الوصول المفتوح
خدمات الكاتب والباحث
إعادة الطبع والأذونات
بيانات البحث
تحرير اللغة
تحرير العلوم
دروس ماجستير نيتشر
حلول البحث
مكتبات ومؤسسات
خدمة وأدوات المكتبيين
بوابة المكتبي
البحث المفتوح
التوصية بالمكتبة
الإعلان والشراكات
الإعلان
الشراكات والخدمات
أدوات الإعلام
مجموعات التطوير المهني
وظائف نيتشر
نيتشر كيريرز
مؤتمرات نيتشر
مواقع إقليمية
نيتشر أفريقيا
نيتشر الصين
نيتشر الهند
نيتشر إيطاليا
نيتشر اليابان
نيتشر كوريا
نيتشر الشرق الأوسط
الخصوصية
سياسة الخصوصية
استخدام ملفات تعريف الارتباط
اختيارات الخصوصية/إدارة ملفات تعريف الارتباط
إشعار قانوني
بيان الوصول
البيانات الشخصية للولايات المتحدة
© 2024 Springer Nature Limited
إغلاق اللافتة
اشترك في نشرة Nature Briefing – ما يهم في العلوم، مجانًا في صندوق البريد الوارد الخاص بك يوميًا.
عنوان البريد الإلكتروني
اشترك
أوافق على معالجة معلوماتي وفقًا لسياسة الخصوصية لشركة نيتشر وشركة Springer Nature Limited.
إغلاق اللافتة
احصل على أهم قصص العلوم في اليوم، مجانًا في صندوق البريد الوارد الخاص بك. اشترك في نشرة Nature Briefing
اترك تعليقاً