الثلاثاء، 22 أكتوبر 2013

الكتاب الإلكتروني


الكتاب الإلكتروني

الفرق بين الكتاب المطبوع والكتاب الإلكتروني والكتاب الإلكتروني التفاعلي
الكتاب الورقي:
الكتاب أيضا هو عبارة عن مجموعة من أوراق مطبوعة من الورق يغطى بين غلافين.
والكتب عبارة عن أوعية المعلومات غير الدورية والتي بطبيعة محتوياتها وتنظيمها وضعت لتُقرأ من أولها لآخرها في تتابع منطقي ولكل منها عنوان محدد حتى ولو صدرت مجمعة تحت سلسلة ما.
أو هو عبارة عن ديوان يضم معلومات أو بيانات عن موضوع واحد أو موضوعات وثيقة الصلة ببعضها، ويتم عرضها من خلال صفحات ورقية مطبوعة.
الكتاب الإلكتروني (E-Book):
هو نشر إلكتروني فيه نصوص وصور، ينتج وينشر ويقرأ على الحواسب أو أجهزة إلكترونية أخرى، قد يكون الكتاب الإلكتروني هو مقابلٌ إلكتروني لكتاب مطبوع، وقد يكون الكتاب قد أُلّف بصورة إلكترونية من البداية، وقد لا يكون هناك كتاب مطبوع مناظر له.
وتُقرأ الكتب الإلكترونية من خلال الحواسب الشخصية، أو أجهزة مخصصة لقراءة الكتب الإلكترونية تعرف بقارئات الكتب الإلكترونية، وقد تستخدم الهواتف الجوالة والحواسب المحمولة لقراءتها.
إذن فالصورة الغالبة لهذا الكتاب عبارة عن صب معلومات الكتاب الورقية بصيغة تمكن الحاسوب من قراءته، وأرشفته مما يتيح مزيدا من الإمكانات في وسائل عرضه كحجم الخط ولونه وتنسيقه، وسرعة البحث عن الكلمات والحروف وإحصائها، وإمكانية الإضافة والحذف والاستبدال، ومن أشهر صيغه (صيغة الوورد، وصيغة التكست، وصيغة ال بي دي إف، وصيغة الإتش تي إ إل).
ملفات مايكروسوفت وورد:: Microsoft Word
هو أحد البرامج الموفرة ضمن حزمة أوفيس وهو مخصص لمعالجة الكلمات وبحيث يتيح إدخال الكلمات بصيغة إلكترونية على وثائق افتراضية، ومن ثم معالجتها وإخراحها بالشكل المطلوب حسب حاجة المستخدم، بحيث يمكن طباعتها على شرائح ورقية أو إبقائها على صيغتها الإلكترونية، وهو من أهم البرامج التي أنتجتها شركة مايكروسوفت الأمريكية لمعالجة النصوص، وقد كان أول إصدار منه في العام 1983 م تحت مسمى Multi-Tool Word وكان هذا البرنامج مخصصًا لنظام التشغيل Xenix وهو أحد إصدارات Unix المرخصة من قبل معامل الهواتف AT&T والذي كانت تبيعه وتروجه من قبل شركة مايكروسوفت قبل إصدار أنظمتها الأخرى الشهيرة للحواسب الشخصية.
وقد صدرت نسخ أخرى من البرنامج مختصة بعدد من الأنظمة، منها على سبيل المثال نظام DOS على أجهزة شركة IBM في العام 1983م، وأيضاً صدر على أنظمة أخرى مثل أبل ماكنتوش (1984م)، وأنظمة SCO وUNIXوOS/2 ومايكروسوفت ويندوز عام 1989 م. أما الآن فبرنامج وورد هو جزء من مجموعة برامج Microsoft Office المعروفة، كما أنَّ البرنامج يباع وحده دون الحاجة إلى شراء المجموعة كاملة.
ملفاتTXT  -RTF :
وهذان النسقان من أبسط أنواع الكتب الإلكترونية نظراً لسهولة إنشاء الكتب بهما، ويمكن عمل ذلك بواسطة برنامجي Notepad وWordpad في نظام مايكروسوفت ويندوز. فيما لا يمكن إنشاء كتاب متقدم في برنامج Notepad فإنه يمكن عمل كتاب مخصص في Wordpad لأنه يدعم تغيير نوع الخط، حجمه، لونه، لون خلفيته، ونوعه لأي جزء محدد من النص، وكذلك يمكن إدراج صور فيما لا يدعم البرنامج الأول هذه الخصائص.
ملفات بي دي إف:
هو نوع من الملفات يفتح بواسطة برنامج أدوبي أكروبات من شركة أدوبي سيستمز. وهذا النوع من الملفات له صفات غير موجودة في الأنواع الأخرى من ملفات الكتب الإلكترونية ومنها:
·         إمكانية تشفير النص بحيث لا يستطيع أحد نسخه كما هو مكتوب.
·         إمكانية إضافة توقيع أو شهادة رقمية من مؤلف الكتاب.
·         إمكانية طباعة كامل صفحات الكتاب، وهناك خيار لتعطيل هذه الإمكانية عند صنع الملف.
ملفات HTML
لغة رقمنة النص الفائق، وهو النسق المستعمل في برمجة صفحات الويب ويستعمل أحيانا لصنع كتب إلكترونية خاصة تلك المعروضة للتصفح والطباعة على شبكة الإنترنت. وهذا النوع من الكتب الإلكترونية عادة ما يتكون من أكثر من صفحة من المعلومات. بعض المؤلفين أو الكاتبين يجعلون صفحة HTML واحدة لكل صفحة يمكن كتابتها في كتاب مطبوع، وبعضهم يجعلون صفحة واحدة لكل فصل من الكتاب وهذه غالباً ما يجعله طويلا بعض الشيء.
خصائص الكتاب الإلكتروني:
·       سهولة نقله وتحميله على أجهزة متنوعة.
·       سهولة الوصول إلي محتوياته باستخدام الكمبيوتر.
·       يحتوى على وسائل متعددة مثل الصور ولقطات الفيديو والرسوم المتحركة والمؤثرات الصوتية المتنوعة وغيرها.
·       سهولة قراءته باستخدام الكمبيوتر أو أجهزة أخرى.
·       إمكانية ربطه بالمراجع العلمية التي تؤخذ منها الاقتباسات حيث يمكن فتح المرجع الأصلي ومشاهدة الاقتباس كما كتبه المؤلف لكتابه.
·       استخدام التعليق أثناء عرض الكتاب.
·       إمكانية عرضه على الطلاب في قاعات الدراسة باستخدام وحدة عرض البيانات LCD أو جهاز العارض الجداري (البروجكتور).
مقارنة بين الكتاب الإلكتروني والكتاب التقليدي:
أولا المميزات:
·       الكتب الإلكترونية أسهل في الحمل والتخزين؛ فهي متاحة للقراء أينما كانوا عن طريق أجهزة الهواتف المحمولة، كما يمكن لقارئ الكتب الإلكترونية حفظ آلاف الكتب، الحد الوحيد هو حجم الذاكرة.
·       يمكن بيع عدد لا نهائي من الكتاب الإلكتروني بدون نفاد الكمية.
·       سهولة الترجمة؛ إذ تتيح بعض المواقع إمكانية ترجمة الكتب الإلكترونية إلى لغات مختلفة، فيكون الكتاب متاحاً بعدة لغات غير التي تم تأليفه بها.
·       تغيير خصائص القارئ الإلكتروني على حسب القارئ حيث يمكن القراءة في الإضائة المنخفضة أو حتى في الظلام. العديد من القارئات الإلكترونية الحديثة بها إمكانية تكبير وتغيير خط الكتاب، وقراءة الكتاب بصوت، والبحث عن كلمات، وإيجاد التعريفات، ووضع علامات. يمكن للكتب التي تستخدم خاصية الحبر الإلكتروني أن تقلد شكل الكتاب المطبوع مع استهلاك ضئيل للطاقة.
·       التكاليف: بينما قارئات الكتب الإلكترونية هي أغلى بكثير من كتاب مطبوع واحد، لكن تكلفة الكتاب الإلكتروني عموماً أقل من الكتاب المطبوع، بل إنه يوجد أكثر من 2 مليون كتاب إلكتروني مجاني على الإنترنت، وكل كتب الخيال مثلاً الصادرة قبل 1900 موجودة في الملكية العامة.
·       الحماية: باستخدام إدارة الحقوق الرقمية يمكن حفظ نسخ احتياطية من الكتب الإلكترونية لاسترجاعها في حالة الضياع أو التلف، بدون الدفع مرة أخرى للناشر.
·       التوزيع: الكتب الإلكترونية أسهل وأسرع في النشر من الكتب المطبوعة.
ثانيا: العيوب:
·       التقنيات المتغيرة: أنواع وصيغ الكتب الإلكترونية مستمرة في التغير والتطور بمرور الوقت مع تطور التقنيات وظهور صيغ جديدة.
·       ليس كل الكتب متاحة في صورة إلكترونية.
·       التحمل: الكتب المطبوعة أكثر تحملاً للأضرار (كالسقوط مثلاً) من جهاز قارئ الكتب الإلكترونية، والذي قد يعطب أو يفقد بعض البيانات.
·       التكلفة: قارئات الكتب الإلكترونية هي أغلى بكثير من كتاب مطبوع واحد. بالإضافة إلى أنه ليس هناك سوق للكتب الإلكترونية المستعملة.
·       الحماية: بسبب التقنية العالية الموجودة في الكتب الإلكترونية، فإنها أكثر عرضة للسرقة من الكتاب المطبوع.
·       محدودية إمكانيات القارئ الإلكتروني: لا زالت دقة شاشة القارئ الإلكتروني ـ غالبًا ـ أقل من دقة الكتب المطبوعة.
·       بسبب إدارة الحقوق الرقمية لا يمكن لمستخدم الكتاب الإلكتروني إعارته لشخص آخر، باستثناء ما صدر مؤخرا من ميزات الإعارة لكتب متجر أمازون وبارنز أند نوبل وغيرهما.
·       الخصوصية: يمكن للكتب الإلكترونية وبرمجياتها مراقبة استعمال وبيانات المستخدم وتكرار قراءته.
·       الكتب المصورة: الكتب المصورة -مثل كتب الأطفال- أو التي تحتوي على أشكال تكون مطالعتها أفضل في الكتب المطبوع.

الكتاب الإلكتروني التفاعلي: هو نظرة أكثر تطورا لعرض الكتاب المنسوخ حاسوبيا، حيث تتم فيه معالجة كل محتويات الكتاب وتطوير نظم عرضه وجعله أكثر فاعلية وتفاعلية.



كيف يمكننا تفعيل تقنيات اللغة في عملية عرض الكتاب الإلكتروني؟
أولا: التحليل الصرفي.
ثانيا: التشكيل الآلي.
ثالثًا: المدقق الصرفي:
رابعًا: العنونة الكلامية (POS).
خامسًا: المعجم الحاسوبي.
سادسًا: التفاعل الصوتي.
أ. تحويل النص المكتوب إلى صوت منطوق.
ب. التعرف على الصوت المنطوق، (أنواع التعرف: كلي وجزئي).




أولا: التحليل الصرفي.
مقدمة:
تعريف التحليل الصرفي:

سيتم إدراجه لاحقا
ثانيا: التشكيل الآلي.
تعريف التشكيل الآلي والفرق بينه وبين التحليل الصرفي.

ثالثًا: المدقق الصرفي:

سيتم إدراجه لاحقا



 العنونة الكلامية (POS).
In corpus linguistics, part-of-speech tagging (POS tagging or POST), also called grammatical tagging or word-category disambiguation, is the process of marking up a word in a text (corpus) as corresponding to a particular part of speech, based on both its definition, as well as its context—i.e. relationship with adjacent and related words in a phrase, sentence, or paragraph. A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc.
Once performed by hand, POS tagging is now done in the context of computational linguistics, using algorithms which associate discrete terms, as well as hidden parts of speech, in accordance with a set of descriptive tags. POS-tagging algorithms fall into two distinctive groups: rule-based and stochastic. E. Brill's tagger, one of the first and widely used English POS-taggers, employs rule-based algorithms.
Part-of-speech tagging is harder than just having a list of words and their parts of speech, because some words can represent more than one part of speech at different times, and because some parts of speech are complex or unspoken. This is not rare—in natural languages (as opposed to many artificial languages), a large percentage of word-forms are ambiguous. For example, even "dogs", which is usually thought of as just a plural noun, can also be a verb:
The sailor dogs the hatch.
Correct grammatical tagging will reflect that "dogs" is here used as a verb, not as the more common plural noun. Grammatical context is one way to determine thi; semantic analysis can also be used to infer that "sailor" and "hatch" implicate "dogs" as 1) in the nautical context and 2) an action applied to the object "hatch" (in this context, "dogs" is a nautical term meaning "fastens (a watertight door) securely).
Schools commonly teach that there are 9 parts of speech in English: noun, verb, article, adjective, preposition, pronoun, adverb, conjunction, and interjection. However, there are clearly many more categories and sub-categories. For nouns, plural, possessive, and singular forms can be distinguished. In many languages words are also marked for their "case" (role as subject, object, etc.), grammatical gender, and so on; while verbs are marked for tense, aspect, and other things. Linguists distinguish parts of speech to various fine degrees, reflecting a chosen "tagging system".
In part-of-speech tagging by computer, it is typical to distinguish from 50 to 150 separate parts of speech for English. For example, NN for singular common nouns, NNS for plural common nouns, NP for singular proper nouns (see the POS tags used in the Brown Corpus). Work on stochastic methods for tagging Koine Greek (DeRose 1990) has used over 1,000 parts of speech, and found that about as many words were ambiguous there as in English. A morphosyntactic descriptor in the case of morphologically rich languages is commonly expressed using very short mnemonics, such as 'Ncmsan for Category=Noun, Type = common, Gender = masculine, Number = singular, Case = accusative, Animate = no.
العنونة الكلامية عبارة عن العلامات النحوصرفية المؤدية إلى فك الالتباس، فمثلا جملة
ضربت مصطفى سعاد
نجد أن الفاعل هنا هو سعاد مع أنها منأخرة في الجملة، وقد علمنا هذه المعلومة من تأنيث الفعل، إذًا التأنيث قد أدى إلى فك الالتباس النحوي ومن ثم الدلالي.
لكن هذا لا يتحقق مع:
ضرب عيسى موسى
لعدم وجود أية قرينة لفظية.
مثال آخر:
العاملون يؤدون واجبهم
نستفيد من كلمة "العاملون":
التعريف، الرفع، الجمع، التذكير.
رابعا: المعجم الحاسوبي.



خامسًا: التفاعل الصوتي.
أ. تحويل النص المكتوب إلى صوت منطوق(TTS).
ب. التعرف على الصوت المنطوق(ASR)، (أنواع التعرف: كلي وجزئي).
ج. البحث الصوتي (Audio Indexer).
الفرق بين TTS و ASR
TTS
ASR
تنوع فونيمي يتواءم مع نسب توزيع الأصوات في اللغة الفعلية.
يتم الإحصاء على مستوى الفونيم الثلاثي وليس الثنائي أو المفرد.
تنوع فونيمي يتواءم مع نسب توزيع الأصوات في اللغة الفعلية.
لا يتم الإحصاء على مستوى الفونيم الثلاثي وليس الثنائي أو المفرد.
يكتفى بتسجيل صوت واحد لمدة ثلاث ساعات
يجب أن تتعدد العينة وتتنوع ما بين صغار وكبار ونساء ورجال، حسب الفئة المستهدفة
جودة التسجيل يجب ألا تقل عن 32ك * 16 بت
جودة تسجيل منخفضة تتناسب مع بيئة المستخدم.
التسجيل بصيغة استريو إضافة إلى EGG
تسجيل مونو
تسجيل داخل أستوديو بمايك مخصص يستبعد الضوضاء وكارت صوت معتمد.
بيئة عادية ومايك عادي وكارت صوت عادي.






ليست هناك تعليقات:

إرسال تعليق