الكتاب الإلكتروني
الفرق بين الكتاب المطبوع والكتاب الإلكتروني
والكتاب الإلكتروني التفاعلي
الكتاب الورقي:
الكتاب أيضا هو عبارة عن مجموعة من أوراق مطبوعة من
الورق يغطى بين غلافين.
والكتب عبارة عن أوعية المعلومات غير الدورية والتي
بطبيعة محتوياتها وتنظيمها وضعت لتُقرأ من أولها لآخرها في تتابع منطقي ولكل منها
عنوان محدد حتى ولو صدرت مجمعة تحت سلسلة ما.
أو هو عبارة عن ديوان يضم معلومات أو بيانات عن
موضوع واحد أو موضوعات وثيقة الصلة ببعضها، ويتم عرضها من خلال صفحات ورقية
مطبوعة.
الكتاب الإلكتروني (E-Book):
هو نشر إلكتروني فيه نصوص وصور، ينتج
وينشر ويقرأ على الحواسب أو أجهزة إلكترونية
أخرى، قد يكون الكتاب الإلكتروني هو مقابلٌ إلكتروني لكتاب مطبوع،
وقد يكون الكتاب قد أُلّف بصورة إلكترونية من البداية، وقد لا يكون هناك كتاب
مطبوع مناظر له.
إذن فالصورة الغالبة لهذا الكتاب عبارة عن صب
معلومات الكتاب الورقية بصيغة تمكن الحاسوب من قراءته، وأرشفته مما يتيح مزيدا من
الإمكانات في وسائل عرضه كحجم الخط ولونه وتنسيقه، وسرعة البحث عن الكلمات والحروف
وإحصائها، وإمكانية الإضافة والحذف والاستبدال، ومن أشهر صيغه (صيغة الوورد، وصيغة
التكست، وصيغة ال بي دي إف، وصيغة الإتش تي إ إل).
ملفات مايكروسوفت وورد::
Microsoft Word
هو أحد البرامج الموفرة ضمن حزمة أوفيس وهو مخصص لمعالجة الكلمات وبحيث يتيح إدخال
الكلمات بصيغة إلكترونية على وثائق افتراضية، ومن ثم معالجتها وإخراحها بالشكل
المطلوب حسب حاجة المستخدم، بحيث يمكن طباعتها على شرائح ورقية أو إبقائها على
صيغتها الإلكترونية، وهو من أهم البرامج التي أنتجتها شركة مايكروسوفت الأمريكية
لمعالجة النصوص، وقد كان أول إصدار منه في العام 1983 م تحت مسمى Multi-Tool Word وكان هذا البرنامج
مخصصًا لنظام التشغيل Xenix وهو
أحد إصدارات Unix المرخصة
من قبل معامل الهواتف AT&T والذي
كانت تبيعه وتروجه من قبل شركة مايكروسوفت قبل
إصدار أنظمتها الأخرى الشهيرة للحواسب الشخصية.
وقد صدرت نسخ أخرى من البرنامج مختصة بعدد من
الأنظمة، منها على سبيل المثال نظام DOS على
أجهزة شركة IBM في
العام 1983م، وأيضاً صدر على أنظمة أخرى مثل أبل ماكنتوش (1984م)، وأنظمة SCO وUNIXوOS/2 ومايكروسوفت
ويندوز عام 1989 م. أما الآن فبرنامج وورد هو جزء من مجموعة برامج Microsoft Office المعروفة،
كما أنَّ البرنامج يباع وحده دون الحاجة إلى شراء المجموعة كاملة.
ملفاتTXT
-RTF
:
وهذان النسقان من أبسط أنواع الكتب الإلكترونية نظراً
لسهولة إنشاء الكتب بهما، ويمكن عمل ذلك بواسطة برنامجي
Notepad وWordpad
في نظام مايكروسوفت ويندوز. فيما لا يمكن إنشاء كتاب متقدم في
برنامج Notepad فإنه
يمكن عمل كتاب مخصص في Wordpad لأنه
يدعم تغيير نوع الخط، حجمه، لونه، لون خلفيته، ونوعه لأي جزء محدد من النص، وكذلك
يمكن إدراج صور فيما لا يدعم البرنامج الأول هذه الخصائص.
ملفات بي دي إف:
هو نوع من الملفات يفتح بواسطة برنامج أدوبي أكروبات من شركة أدوبي سيستمز. وهذا النوع من الملفات له صفات
غير موجودة في الأنواع الأخرى من ملفات الكتب الإلكترونية ومنها:
·
إمكانية
تشفير النص بحيث لا يستطيع أحد نسخه كما هو مكتوب.
·
إمكانية
إضافة توقيع أو شهادة رقمية من مؤلف الكتاب.
·
إمكانية
طباعة كامل صفحات الكتاب، وهناك خيار لتعطيل هذه الإمكانية عند صنع الملف.
ملفات HTML
لغة رقمنة النص الفائق،
وهو النسق المستعمل في برمجة صفحات الويب ويستعمل أحيانا لصنع كتب إلكترونية خاصة
تلك المعروضة للتصفح والطباعة على شبكة الإنترنت. وهذا النوع من الكتب الإلكترونية
عادة ما يتكون من أكثر من صفحة من المعلومات. بعض المؤلفين أو الكاتبين يجعلون
صفحة HTML واحدة
لكل صفحة يمكن كتابتها في كتاب مطبوع، وبعضهم يجعلون صفحة واحدة لكل فصل من الكتاب
وهذه غالباً ما يجعله طويلا بعض الشيء.
خصائص الكتاب الإلكتروني:
· سهولة نقله وتحميله على أجهزة متنوعة.
· سهولة الوصول إلي محتوياته باستخدام
الكمبيوتر.
· يحتوى على وسائل متعددة مثل الصور
ولقطات الفيديو والرسوم المتحركة والمؤثرات الصوتية المتنوعة وغيرها.
· سهولة قراءته باستخدام الكمبيوتر أو
أجهزة أخرى.
· إمكانية ربطه بالمراجع العلمية التي
تؤخذ منها الاقتباسات حيث يمكن فتح المرجع الأصلي ومشاهدة الاقتباس كما كتبه
المؤلف لكتابه.
· استخدام التعليق أثناء عرض الكتاب.
· إمكانية عرضه على الطلاب في قاعات
الدراسة باستخدام وحدة عرض البيانات LCD أو
جهاز العارض الجداري (البروجكتور).
مقارنة بين الكتاب
الإلكتروني والكتاب التقليدي:
أولا المميزات:
· يمكن بيع عدد لا نهائي من الكتاب
الإلكتروني بدون نفاد الكمية.
· سهولة الترجمة؛ إذ تتيح بعض المواقع
إمكانية ترجمة الكتب الإلكترونية إلى لغات مختلفة، فيكون الكتاب متاحاً بعدة لغات
غير التي تم تأليفه بها.
· تغيير خصائص القارئ الإلكتروني على حسب
القارئ حيث يمكن القراءة في الإضائة المنخفضة أو حتى في الظلام. العديد من
القارئات الإلكترونية الحديثة بها إمكانية تكبير وتغيير خط الكتاب، وقراءة الكتاب
بصوت، والبحث عن كلمات، وإيجاد التعريفات، ووضع علامات. يمكن للكتب التي تستخدم خاصية الحبر الإلكتروني أن تقلد شكل الكتاب
المطبوع مع استهلاك ضئيل للطاقة.
· التكاليف: بينما قارئات الكتب الإلكترونية هي أغلى بكثير من
كتاب مطبوع واحد، لكن تكلفة الكتاب الإلكتروني عموماً أقل من الكتاب المطبوع، بل
إنه يوجد أكثر من 2 مليون كتاب إلكتروني مجاني
على الإنترنت، وكل كتب الخيال مثلاً الصادرة قبل 1900 موجودة
في الملكية العامة.
· الحماية: باستخدام إدارة الحقوق الرقمية يمكن حفظ نسخ
احتياطية من الكتب الإلكترونية لاسترجاعها في حالة الضياع أو التلف، بدون الدفع
مرة أخرى للناشر.
· التوزيع: الكتب الإلكترونية أسهل وأسرع
في النشر من الكتب المطبوعة.
ثانيا: العيوب:
· التقنيات المتغيرة: أنواع وصيغ الكتب
الإلكترونية مستمرة
في التغير والتطور بمرور الوقت مع تطور التقنيات وظهور صيغ جديدة.
· ليس كل الكتب متاحة في صورة إلكترونية.
· التحمل:
الكتب المطبوعة أكثر تحملاً للأضرار (كالسقوط
مثلاً) من جهاز قارئ الكتب الإلكترونية، والذي قد يعطب أو يفقد بعض البيانات.
· التكلفة:
قارئات الكتب الإلكترونية هي أغلى بكثير من كتاب
مطبوع واحد. بالإضافة إلى أنه ليس هناك سوق للكتب الإلكترونية المستعملة.
· الحماية:
بسبب التقنية العالية الموجودة في الكتب
الإلكترونية، فإنها أكثر عرضة للسرقة من الكتاب المطبوع.
· الخصوصية:
يمكن للكتب الإلكترونية وبرمجياتها مراقبة استعمال
وبيانات المستخدم وتكرار قراءته.
· الكتب المصورة:
الكتب المصورة -مثل كتب الأطفال- أو التي تحتوي على
أشكال تكون مطالعتها أفضل في الكتب المطبوع.
الكتاب الإلكتروني التفاعلي: هو
نظرة أكثر تطورا لعرض الكتاب المنسوخ حاسوبيا، حيث تتم فيه معالجة كل محتويات
الكتاب وتطوير نظم عرضه وجعله أكثر فاعلية وتفاعلية.
كيف يمكننا تفعيل تقنيات اللغة في عملية عرض الكتاب
الإلكتروني؟
أولا: التحليل الصرفي.
ثانيا: التشكيل الآلي.
ثالثًا: المدقق الصرفي:
رابعًا: العنونة الكلامية (POS).
خامسًا: المعجم الحاسوبي.
سادسًا: التفاعل الصوتي.
أ. تحويل النص المكتوب إلى صوت منطوق.
ب. التعرف على الصوت المنطوق، (أنواع التعرف: كلي وجزئي).
أولا: التحليل الصرفي.
مقدمة:
تعريف التحليل الصرفي:
سيتم إدراجه لاحقا
ثانيا: التشكيل الآلي.
تعريف التشكيل الآلي والفرق بينه وبين التحليل
الصرفي.
ثالثًا: المدقق الصرفي:
سيتم إدراجه لاحقا
العنونة
الكلامية (POS).
In corpus
linguistics, part-of-speech tagging (POS tagging or POST), also called
grammatical tagging or word-category disambiguation, is the process of marking
up a word in a text (corpus) as corresponding to a particular part of speech,
based on both its definition, as well as its context—i.e. relationship with
adjacent and related words in a phrase, sentence, or paragraph. A simplified
form of this is commonly taught to school-age children, in the identification
of words as nouns, verbs, adjectives, adverbs, etc.
Once performed by
hand, POS tagging is now done in the context of computational linguistics,
using algorithms which associate discrete terms, as well as hidden parts of
speech, in accordance with a set of descriptive tags. POS-tagging algorithms
fall into two distinctive groups: rule-based and stochastic. E. Brill's tagger,
one of the first and widely used English POS-taggers, employs rule-based
algorithms.
Part-of-speech
tagging is harder than just having a list of words and their parts of speech,
because some words can represent more than one part of speech at different
times, and because some parts of speech are complex or unspoken. This is not
rare—in natural languages (as opposed to many artificial languages), a large
percentage of word-forms are ambiguous. For example, even "dogs",
which is usually thought of as just a plural noun, can also be a verb:
The sailor dogs the
hatch.
Correct grammatical
tagging will reflect that "dogs" is here used as a verb, not as the
more common plural noun. Grammatical context is one way to determine thi;
semantic analysis can also be used to infer that "sailor" and
"hatch" implicate "dogs" as 1) in the nautical context and
2) an action applied to the object "hatch" (in this context,
"dogs" is a nautical term meaning "fastens (a watertight door)
securely).
Schools commonly
teach that there are 9 parts of speech in English: noun, verb, article,
adjective, preposition, pronoun, adverb, conjunction, and interjection.
However, there are clearly many more categories and sub-categories. For nouns,
plural, possessive, and singular forms can be distinguished. In many languages
words are also marked for their "case" (role as subject, object,
etc.), grammatical gender, and so on; while verbs are marked for tense, aspect,
and other things. Linguists distinguish parts of speech to various fine
degrees, reflecting a chosen "tagging system".
In part-of-speech
tagging by computer, it is typical to distinguish from 50 to 150 separate parts
of speech for English. For example, NN for singular common nouns, NNS for
plural common nouns, NP for singular proper nouns (see the POS tags used in the
Brown Corpus). Work on stochastic methods for tagging Koine Greek (DeRose 1990)
has used over 1,000 parts of speech, and found that about as many words were
ambiguous there as in English. A morphosyntactic descriptor in the case of
morphologically rich languages is commonly expressed using very short
mnemonics, such as 'Ncmsan for Category=Noun, Type = common, Gender =
masculine, Number = singular, Case = accusative, Animate = no.
العنونة الكلامية عبارة عن العلامات النحوصرفية
المؤدية إلى فك الالتباس، فمثلا جملة
ضربت مصطفى سعاد
نجد أن الفاعل هنا هو سعاد مع أنها منأخرة في
الجملة، وقد علمنا هذه المعلومة من تأنيث الفعل، إذًا التأنيث قد أدى إلى فك
الالتباس النحوي ومن ثم الدلالي.
لكن هذا لا يتحقق مع:
ضرب عيسى موسى
لعدم وجود أية قرينة لفظية.
مثال آخر:
العاملون يؤدون واجبهم
نستفيد من كلمة "العاملون":
التعريف، الرفع، الجمع، التذكير.
رابعا: المعجم الحاسوبي.
خامسًا: التفاعل الصوتي.
أ. تحويل النص المكتوب إلى صوت منطوق(TTS).
ب. التعرف على الصوت المنطوق(ASR)، (أنواع التعرف: كلي وجزئي).
ج. البحث الصوتي (Audio
Indexer).
الفرق بين TTS و ASR
TTS
|
ASR
|
تنوع
فونيمي يتواءم مع نسب توزيع الأصوات في اللغة الفعلية.
يتم
الإحصاء على مستوى الفونيم الثلاثي وليس الثنائي أو المفرد.
|
تنوع
فونيمي يتواءم مع نسب توزيع الأصوات في اللغة الفعلية.
لا
يتم الإحصاء على مستوى الفونيم الثلاثي وليس الثنائي أو المفرد.
|
يكتفى
بتسجيل صوت واحد لمدة ثلاث ساعات
|
يجب
أن تتعدد العينة وتتنوع ما بين صغار وكبار ونساء ورجال، حسب الفئة المستهدفة
|
جودة
التسجيل يجب ألا تقل عن 32ك * 16 بت
|
جودة
تسجيل منخفضة تتناسب مع بيئة المستخدم.
|
التسجيل
بصيغة استريو إضافة إلى EGG
|
تسجيل
مونو
|
تسجيل
داخل أستوديو بمايك مخصص يستبعد الضوضاء وكارت صوت معتمد.
|
بيئة
عادية ومايك عادي وكارت صوت عادي.
|