Ahmed Ragheb: أكتوبر 2013

كتاب جمهرة اللغة لابن دريد

المؤلف:

ألفه أبو بكر بن دريد المتوفي سنة 321 هجرية الذي كان عمدة اللغويين في عصره، وإمامًا لأهل البصرة في اللغة، ومن تلاميذه أبو علي القالي وابن خالويه وأبو فرج الأصفهاني.

قصة الكتاب وأهميته:

معجم ابن دريد: ألفه في فارس، وكان في مقدمة الكتب التي بنى الأزهري كتابه (تهذيب اللغة) للرد عليها، وقد رتبه على حروف المعجم مبتدئاً بالثنائي الصحيح، ناهجاً منهاج الخليل في تقليب حروف الكلمة على كل وجوهها، فإذا أردت البحث عن فعل (لبس) فسوف تجده في مادة (بسل) لأن الباء تتقدم السين واللام في النظام الألفبائي، وهكذا إذا أردت البحث عن مادة (لقب) أو (قلب) فسوف تجدها في مادة (بقل). قال: (وابتدأت بذكر الحروف المعجمة التي هي أصل تفرع عنها جميع الكلام، وعليها مدار تاليفه، وإليها مآل أبنيته، فالمنصف له بالغلبة معترف، والمعاند متكلف، وكل من بعده له تبع)، والمشهور أن نسخ الجمهرة كثيرة الزيادة والنقصان؛ لأن ابن دريد أملاها بفارس ثم ببغداد من حفظه، فلما اختلف الإملاء زاد ونقص، والنسخة الباقية التي عليها المعول، هي النسخة الأخيرة، وآخر ما صح من النسخ: نسخة أبي الفتح النحوي؛ لأنه كتبها من عدة نسخ، وقرأها على ابن دريد، وكغيره من الكتب السائرة أقبل الناس على إدلاء دلائهم في الاستدراك عليه، وتوضيح غريبه، وترجمة مواده، وأول من ألف كتاباً فيه: غلام ثعلب، وسمى كتابه (فائت الجمهرة)، وألف أبو العلاء المعري كتاباً في شرح شواهده سماه (نشر شواهد الجمهرة)، واختصرها الصاحب ابن عباد في كتاب سماه (جوهرة الجمهرة)، واختصرها ابن عنين الشاعر، وحفظ مختصره، أما ابن منظور فأودعها كلها في كتابه (لسان العرب)، وذكر ابن سيده أنه استفرغها في (المحكم) و(المخصص)، إلا أن الناظر فيه يرى أنه اقتصر على نقل أبواب منها، وكانت عمدة الناس في اللغة حتى القرن السادس، ثم تركها الناس وعكفوا على كتب أخرى.

سبب التسمية:

وقد قال ابن دريد في مقدمة كتابه معللا سبب تسميته بالجمهرة "وإنما أعرناه هذا الاسم لأنا اخترنا له الجمهور من كلام العرب، وأرجأناه الوحشيَّ والمستنكر"ـ وقد ذكر ابن دريد في معجمه اللفظ الشائع وليس الغريب النادر؛ حيث أفرد ابن دريد للنوادر من الألفاظ أبوابًا ملحقة في آخر الجمهرة، فقد كان غرضه يشبه إلى حد ما غرض الجوهري وهو تصفية اللغة من الشوائب واستبعاد بعض ألفاظها.

المنهج:

1. أما منهج ابن دريد في الجهمرة فهو يختلف عن منهج الخليل في كتاب العين برغم من تأثير كتاب العين في المعاجم التي ألفت بعده بما فيها كتاب الجمهرة.

2. أرجع الكلمات إلى حروفها الأصلية، فجردها من الزوائد، وأرجع المقلوب إلى أصله، شأنه شأن معظم المعاجم.

3. استعمل ابن دريد النظام الألفبائي أساسًا لترتيب ألفاظها، ويتضح من مقدمة الجمهرة أنَّ ابن دريد قصد هذا المنهج، وفضله على منهج كتاب العين، فهو برغم إجلاله للخليل وسائر العلماء المتقدمين لم يرق له ترتيب معجمه على حسب مخارج الحروف.

4. ابتكر نظام التقليب الألفبائي؛ حيث تبنى نظام التقاليب الذي ابتدعه الخليل في العين على حسب مبدأ الاشتقاق؛ لأنَّ غالبية ألفاظ العربية من الثلاثي، فمثلا كلمة بقل أورد تقاليبها (قلب لبق قبل بلق)، وقد استوفى المادة دفعة واحدة؛ ولذلك لا ضرورة لتناول بعض أوجهها فيما بعد اكتفاء منه بما تقدم حتى لا يقع في التكرار.

5. قام ابن دريد بترتيب الجمهرة داخليًّا على أساس الأبنية على غرار ما فعل الخليل في ترتيب الحروف، فالألفاظ عنده ثنائية وثلاثية ورباعية وخماسية.

6. راعى ابن دريد أن يبدأ كل باب بالكلمة التي تبدأ بالحرف المعقود له الباب يليه الحرف الذي بعده في الترتيب الألفبائي، فباب الباء يصدره مع التاء، وباب التاء مع الثاء، وعندما يبلغ باب الراء يذكر الأصول التي تبدأ بالراء فزاي مثل: رزم رزق، ثم ذكر الأصول التي تبدأ بحرف الراء فحرف السين، مثل: رسغ رسف رسل، ولكنه لا يذكر في هذا الباب ربح لأنه ذكرها في جرح.

7. جعل ابن دريد للفظ الثنائي الثلاثي والرباعي والخماسي ملحقات، فالمعجم مقسم عنده إلى الثنائي المضاعف وما يلحق به فالثلاثي وما يلحق به...الخ، وقد بدأت الجمهرة بباب الثئائي الصحيح، ويبدأ بالهمزة على هذا النحو (أب ب، أت ت ثم أث ث، وهكذا)، وفي باب الباء يبدأ بإيراد (ب ت ت) البت، ومن معكوسة (تبت يدا) ثم (ب ث ث) ثم (ب ج ج)، واستعمل من معكوسة جب وناقة جباء وبعسر أجب، وبعد ذلك يأتي الجزء الآخر من المعجم ويتضمن أبواب الثلاثي الصحيح وما تشعب منه، ويضم معظم ألفاظ المعجم كأن يورد مثلا (ب ت ث)، (ب ت ج)، (ب ت ح).

مميزات الكتاب:

يمتاز كتاب الجمهرة بأنه أصل راسخ من الأصول التي اعتمد عليها مؤلفو المعاجم بعده، وقد عرف بعنايته بإيراد لهجات العرب ولغاتها وباهتمامه بالدخيل والمعرب، غير أن الجمهرة لم يحظ بالانتشار الواسع بسبب صعوبة وتعقيد أسلوبها، ومن هنا دعت الحاجة إلى عمل فهارس مفصلة بمحتواها مما يسهل الانتفاع منها وقد حظيت مع ذلك بعناية الأقدمين من العلماء؛ فقامت حولها دراسات عديدة، منها فائت الجمهرة لأبي عمر الزاهد، وجوهرة الجمهرة للصاحب بن عباد وهي مختصر للجمهرة، ونشر شواهد الجمهرة لأبي العلاء المعري وكلها مفقود.

طبعت جمهرة اللغة في حيدرأباد بالهند سنة 1926 في ثلاثة مجلدات من القطع الكبير في نحو 1500 صفحة بالإضافة إلى مجلد يزيد على نصف حجمها يحتوي على فهارس مفصلة لمحتواها وكان ذلك بعناية محمد السورتي والمستشرق سالم كرنكو.

الكتاب الإلكتروني

الفرق بين الكتاب المطبوع والكتاب الإلكتروني والكتاب الإلكتروني التفاعلي

الكتاب الورقي:

الكتاب أيضا هو عبارة عن مجموعة من أوراق مطبوعة من الورق يغطى بين غلافين.

والكتب عبارة عن أوعية المعلومات غير الدورية والتي بطبيعة محتوياتها وتنظيمها وضعت لتُقرأ من أولها لآخرها في تتابع منطقي ولكل منها عنوان محدد حتى ولو صدرت مجمعة تحت سلسلة ما.

أو هو عبارة عن ديوان يضم معلومات أو بيانات عن موضوع واحد أو موضوعات وثيقة الصلة ببعضها، ويتم عرضها من خلال صفحات ورقية مطبوعة.

الكتاب الإلكتروني (E-Book):

هو نشر إلكتروني فيه نصوص وصور، ينتج وينشر ويقرأ على الحواسب أو أجهزة إلكترونية أخرى، قد يكون الكتاب الإلكتروني هو مقابلٌ إلكتروني لكتاب مطبوع، وقد يكون الكتاب قد أُلّف بصورة إلكترونية من البداية، وقد لا يكون هناك كتاب مطبوع مناظر له.

وتُقرأ الكتب الإلكترونية من خلال الحواسب الشخصية، أو أجهزة مخصصة لقراءة الكتب الإلكترونية تعرف بقارئات الكتب الإلكترونية، وقد تستخدم الهواتف الجوالة والحواسب المحمولة لقراءتها.

إذن فالصورة الغالبة لهذا الكتاب عبارة عن صب معلومات الكتاب الورقية بصيغة تمكن الحاسوب من قراءته، وأرشفته مما يتيح مزيدا من الإمكانات في وسائل عرضه كحجم الخط ولونه وتنسيقه، وسرعة البحث عن الكلمات والحروف وإحصائها، وإمكانية الإضافة والحذف والاستبدال، ومن أشهر صيغه (صيغة الوورد، وصيغة التكست، وصيغة ال بي دي إف، وصيغة الإتش تي إ إل).

ملفات مايكروسوفت وورد:: Microsoft Word

هو أحد البرامج الموفرة ضمن حزمة أوفيس وهو مخصص لمعالجة الكلمات وبحيث يتيح إدخال الكلمات بصيغة إلكترونية على وثائق افتراضية، ومن ثم معالجتها وإخراحها بالشكل المطلوب حسب حاجة المستخدم، بحيث يمكن طباعتها على شرائح ورقية أو إبقائها على صيغتها الإلكترونية، وهو من أهم البرامج التي أنتجتها شركة مايكروسوفت الأمريكية لمعالجة النصوص، وقد كان أول إصدار منه في العام 1983 م تحت مسمى Multi-Tool Word وكان هذا البرنامج مخصصًا لنظام التشغيل Xenix وهو أحد إصدارات Unix المرخصة من قبل معامل الهواتف AT&T والذي كانت تبيعه وتروجه من قبل شركة مايكروسوفت قبل إصدار أنظمتها الأخرى الشهيرة للحواسب الشخصية.

وقد صدرت نسخ أخرى من البرنامج مختصة بعدد من الأنظمة، منها على سبيل المثال نظام DOS على أجهزة شركة IBM في العام 1983م، وأيضاً صدر على أنظمة أخرى مثل أبل ماكنتوش (1984م)، وأنظمة SCO وUNIX وOS/2 ومايكروسوفت ويندوز عام 1989 م. أما الآن فبرنامج وورد هو جزء من مجموعة برامج Microsoft Office المعروفة، كما أنَّ البرنامج يباع وحده دون الحاجة إلى شراء المجموعة كاملة.

ملفاتTXT -RTF :

وهذان النسقان من أبسط أنواع الكتب الإلكترونية نظراً لسهولة إنشاء الكتب بهما، ويمكن عمل ذلك بواسطة برنامجي Notepad وWordpad في نظام مايكروسوفت ويندوز. فيما لا يمكن إنشاء كتاب متقدم في برنامج Notepad فإنه يمكن عمل كتاب مخصص في Wordpad لأنه يدعم تغيير نوع الخط، حجمه، لونه، لون خلفيته، ونوعه لأي جزء محدد من النص، وكذلك يمكن إدراج صور فيما لا يدعم البرنامج الأول هذه الخصائص.

ملفات بي دي إف:

هو نوع من الملفات يفتح بواسطة برنامج أدوبي أكروبات من شركة أدوبي سيستمز. وهذا النوع من الملفات له صفات غير موجودة في الأنواع الأخرى من ملفات الكتب الإلكترونية ومنها:

· إمكانية تشفير النص بحيث لا يستطيع أحد نسخه كما هو مكتوب.

· إمكانية إضافة توقيع أو شهادة رقمية من مؤلف الكتاب.

· إمكانية طباعة كامل صفحات الكتاب، وهناك خيار لتعطيل هذه الإمكانية عند صنع الملف.

ملفات HTML

لغة رقمنة النص الفائق، وهو النسق المستعمل في برمجة صفحات الويب ويستعمل أحيانا لصنع كتب إلكترونية خاصة تلك المعروضة للتصفح والطباعة على شبكة الإنترنت. وهذا النوع من الكتب الإلكترونية عادة ما يتكون من أكثر من صفحة من المعلومات. بعض المؤلفين أو الكاتبين يجعلون صفحة HTML واحدة لكل صفحة يمكن كتابتها في كتاب مطبوع، وبعضهم يجعلون صفحة واحدة لكل فصل من الكتاب وهذه غالباً ما يجعله طويلا بعض الشيء.

خصائص الكتاب الإلكتروني:

· سهولة نقله وتحميله على أجهزة متنوعة.

· سهولة الوصول إلي محتوياته باستخدام الكمبيوتر.

· يحتوى على وسائل متعددة مثل الصور ولقطات الفيديو والرسوم المتحركة والمؤثرات الصوتية المتنوعة وغيرها.

· سهولة قراءته باستخدام الكمبيوتر أو أجهزة أخرى.

· إمكانية ربطه بالمراجع العلمية التي تؤخذ منها الاقتباسات حيث يمكن فتح المرجع الأصلي ومشاهدة الاقتباس كما كتبه المؤلف لكتابه.

· استخدام التعليق أثناء عرض الكتاب.

· إمكانية عرضه على الطلاب في قاعات الدراسة باستخدام وحدة عرض البيانات LCD أو جهاز العارض الجداري (البروجكتور).

مقارنة بين الكتاب الإلكتروني والكتاب التقليدي:

أولا المميزات:

· الكتب الإلكترونية أسهل في الحمل والتخزين؛ فهي متاحة للقراء أينما كانوا عن طريق أجهزة الهواتف المحمولة، كما يمكن لقارئ الكتب الإلكترونية حفظ آلاف الكتب، الحد الوحيد هو حجم الذاكرة.

· يمكن بيع عدد لا نهائي من الكتاب الإلكتروني بدون نفاد الكمية.

· سهولة الترجمة؛ إذ تتيح بعض المواقع إمكانية ترجمة الكتب الإلكترونية إلى لغات مختلفة، فيكون الكتاب متاحاً بعدة لغات غير التي تم تأليفه بها.

· تغيير خصائص القارئ الإلكتروني على حسب القارئ حيث يمكن القراءة في الإضائة المنخفضة أو حتى في الظلام. العديد من القارئات الإلكترونية الحديثة بها إمكانية تكبير وتغيير خط الكتاب، وقراءة الكتاب بصوت، والبحث عن كلمات، وإيجاد التعريفات، ووضع علامات. يمكن للكتب التي تستخدم خاصية الحبر الإلكتروني أن تقلد شكل الكتاب المطبوع مع استهلاك ضئيل للطاقة.

· التكاليف: بينما قارئات الكتب الإلكترونية هي أغلى بكثير من كتاب مطبوع واحد، لكن تكلفة الكتاب الإلكتروني عموماً أقل من الكتاب المطبوع، بل إنه يوجد أكثر من 2 مليون كتاب إلكتروني مجاني على الإنترنت، وكل كتب الخيال مثلاً الصادرة قبل 1900 موجودة في الملكية العامة.

· الحماية: باستخدام إدارة الحقوق الرقمية يمكن حفظ نسخ احتياطية من الكتب الإلكترونية لاسترجاعها في حالة الضياع أو التلف، بدون الدفع مرة أخرى للناشر.

· التوزيع: الكتب الإلكترونية أسهل وأسرع في النشر من الكتب المطبوعة.

ثانيا: العيوب:

· التقنيات المتغيرة: أنواع وصيغ الكتب الإلكترونية مستمرة في التغير والتطور بمرور الوقت مع تطور التقنيات وظهور صيغ جديدة.

· ليس كل الكتب متاحة في صورة إلكترونية.

· التحمل: الكتب المطبوعة أكثر تحملاً للأضرار (كالسقوط مثلاً) من جهاز قارئ الكتب الإلكترونية، والذي قد يعطب أو يفقد بعض البيانات.

· التكلفة: قارئات الكتب الإلكترونية هي أغلى بكثير من كتاب مطبوع واحد. بالإضافة إلى أنه ليس هناك سوق للكتب الإلكترونية المستعملة.

· الحماية: بسبب التقنية العالية الموجودة في الكتب الإلكترونية، فإنها أكثر عرضة للسرقة من الكتاب المطبوع.

· محدودية إمكانيات القارئ الإلكتروني: لا زالت دقة شاشة القارئ الإلكتروني ـ غالبًا ـ أقل من دقة الكتب المطبوعة.

· بسبب إدارة الحقوق الرقمية لا يمكن لمستخدم الكتاب الإلكتروني إعارته لشخص آخر، باستثناء ما صدر مؤخرا من ميزات الإعارة لكتب متجر أمازون وبارنز أند نوبل وغيرهما.

· الخصوصية: يمكن للكتب الإلكترونية وبرمجياتها مراقبة استعمال وبيانات المستخدم وتكرار قراءته.

· الكتب المصورة: الكتب المصورة -مثل كتب الأطفال- أو التي تحتوي على أشكال تكون مطالعتها أفضل في الكتب المطبوع.

الكتاب الإلكتروني التفاعلي: هو نظرة أكثر تطورا لعرض الكتاب المنسوخ حاسوبيا، حيث تتم فيه معالجة كل محتويات الكتاب وتطوير نظم عرضه وجعله أكثر فاعلية وتفاعلية.

كيف يمكننا تفعيل تقنيات اللغة في عملية عرض الكتاب الإلكتروني؟

أولا: التحليل الصرفي.

ثانيا: التشكيل الآلي.

ثالثًا: المدقق الصرفي:

رابعًا: العنونة الكلامية (POS).

خامسًا: المعجم الحاسوبي.

سادسًا: التفاعل الصوتي.

أ. تحويل النص المكتوب إلى صوت منطوق.

ب. التعرف على الصوت المنطوق، (أنواع التعرف: كلي وجزئي).

أولا: التحليل الصرفي.

مقدمة:

تعريف التحليل الصرفي:

سيتم إدراجه لاحقا

ثانيا: التشكيل الآلي.

تعريف التشكيل الآلي والفرق بينه وبين التحليل الصرفي.

http://tahadz.com/mishkal/

ثالثًا: المدقق الصرفي:

سيتم إدراجه لاحقا

العنونة الكلامية (POS).

In corpus linguistics, part-of-speech tagging (POS tagging or POST), also called grammatical tagging or word-category disambiguation, is the process of marking up a word in a text (corpus) as corresponding to a particular part of speech, based on both its definition, as well as its context—i.e. relationship with adjacent and related words in a phrase, sentence, or paragraph. A simplified form of this is commonly taught to school-age children, in the identification of words as nouns, verbs, adjectives, adverbs, etc.

Once performed by hand, POS tagging is now done in the context of computational linguistics, using algorithms which associate discrete terms, as well as hidden parts of speech, in accordance with a set of descriptive tags. POS-tagging algorithms fall into two distinctive groups: rule-based and stochastic. E. Brill's tagger, one of the first and widely used English POS-taggers, employs rule-based algorithms.

Part-of-speech tagging is harder than just having a list of words and their parts of speech, because some words can represent more than one part of speech at different times, and because some parts of speech are complex or unspoken. This is not rare—in natural languages (as opposed to many artificial languages), a large percentage of word-forms are ambiguous. For example, even "dogs", which is usually thought of as just a plural noun, can also be a verb:

The sailor dogs the hatch.

Correct grammatical tagging will reflect that "dogs" is here used as a verb, not as the more common plural noun. Grammatical context is one way to determine thi; semantic analysis can also be used to infer that "sailor" and "hatch" implicate "dogs" as 1) in the nautical context and 2) an action applied to the object "hatch" (in this context, "dogs" is a nautical term meaning "fastens (a watertight door) securely).

Schools commonly teach that there are 9 parts of speech in English: noun, verb, article, adjective, preposition, pronoun, adverb, conjunction, and interjection. However, there are clearly many more categories and sub-categories. For nouns, plural, possessive, and singular forms can be distinguished. In many languages words are also marked for their "case" (role as subject, object, etc.), grammatical gender, and so on; while verbs are marked for tense, aspect, and other things. Linguists distinguish parts of speech to various fine degrees, reflecting a chosen "tagging system".

In part-of-speech tagging by computer, it is typical to distinguish from 50 to 150 separate parts of speech for English. For example, NN for singular common nouns, NNS for plural common nouns, NP for singular proper nouns (see the POS tags used in the Brown Corpus). Work on stochastic methods for tagging Koine Greek (DeRose 1990) has used over 1,000 parts of speech, and found that about as many words were ambiguous there as in English. A morphosyntactic descriptor in the case of morphologically rich languages is commonly expressed using very short mnemonics, such as 'Ncmsan for Category=Noun, Type = common, Gender = masculine, Number = singular, Case = accusative, Animate = no.

العنونة الكلامية عبارة عن العلامات النحوصرفية المؤدية إلى فك الالتباس، فمثلا جملة

ضربت مصطفى سعاد

نجد أن الفاعل هنا هو سعاد مع أنها منأخرة في الجملة، وقد علمنا هذه المعلومة من تأنيث الفعل، إذًا التأنيث قد أدى إلى فك الالتباس النحوي ومن ثم الدلالي.

لكن هذا لا يتحقق مع:

ضرب عيسى موسى

لعدم وجود أية قرينة لفظية.

مثال آخر:

العاملون يؤدون واجبهم

نستفيد من كلمة "العاملون":

التعريف، الرفع، الجمع، التذكير.

رابعا: المعجم الحاسوبي.

خامسًا: التفاعل الصوتي.

أ. تحويل النص المكتوب إلى صوت منطوق(TTS).

ب. التعرف على الصوت المنطوق(ASR)، (أنواع التعرف: كلي وجزئي).

ج. البحث الصوتي (Audio Indexer).

الفرق بين TTS و ASR

TTS	ASR
تنوع فونيمي يتواءم مع نسب توزيع الأصوات في اللغة الفعلية. يتم الإحصاء على مستوى الفونيم الثلاثي وليس الثنائي أو المفرد.	تنوع فونيمي يتواءم مع نسب توزيع الأصوات في اللغة الفعلية. لا يتم الإحصاء على مستوى الفونيم الثلاثي وليس الثنائي أو المفرد.
يكتفى بتسجيل صوت واحد لمدة ثلاث ساعات	يجب أن تتعدد العينة وتتنوع ما بين صغار وكبار ونساء ورجال، حسب الفئة المستهدفة
جودة التسجيل يجب ألا تقل عن 32ك * 16 بت	جودة تسجيل منخفضة تتناسب مع بيئة المستخدم.
التسجيل بصيغة استريو إضافة إلى EGG	تسجيل مونو
تسجيل داخل أستوديو بمايك مخصص يستبعد الضوضاء وكارت صوت معتمد.	بيئة عادية ومايك عادي وكارت صوت عادي.

Ahmed Ragheb

الثلاثاء، 22 أكتوبر 2013

علم المعاجم - معجم الجمهرة

الكتاب الإلكتروني