القائمة الرئيسية

الصفحات

 منصة تحفيظ القران الكريم اون لاين 

https://quranmo.com

 

التعلم الآلي هو دراسة خوارزميات الكمبيوتر التي يمكن أن تتحسن تلقائيًا من خلال التجربة وباستخدام البيانات. يُنظر إليه على أنه جزء من الذكاء الاصطناعي. تبني خوارزميات التعلم الآلي نموذجًا يعتمد على بيانات نموذجية ، تُعرف باسم "بيانات التدريب" ، من أجل وضع تنبؤات أو قرارات دون أن تتم برمجتها بشكل صريح للقيام بذلك. تُستخدم خوارزميات التعلم الآلي في مجموعة متنوعة من التطبيقات ، مثل الطب ، وتصفية البريد الإلكتروني ، والتعرف على الكلام ، ورؤية الكمبيوتر ، حيث يكون من الصعب أو غير المجدي تطوير خوارزميات تقليدية لأداء المهام المطلوبة.

ترتبط مجموعة فرعية من التعلم الآلي ارتباطًا وثيقًا بالإحصاءات الحسابية ، والتي تركز على إجراء تنبؤات باستخدام أجهزة الكمبيوتر ؛ ولكن ليس كل التعلم الآلي هو تعلم إحصائي. توفر دراسة التحسين الرياضي الأساليب والنظرية ومجالات التطبيق في مجال التعلم الآلي. يعد التنقيب عن البيانات مجالًا ذا صلة بالدراسة ، مع التركيز على تحليل البيانات الاستكشافية من خلال التعلم غير الخاضع للإشراف. تستخدم بعض تطبيقات التعلم الآلي البيانات والشبكات العصبية بطريقة تحاكي عمل الدماغ البيولوجي. يُشار أيضًا إلى التعلم الآلي في تطبيقه عبر مشاكل العمل ، باسم التحليلات التنبؤية.

ملخص

يتضمن التعلم الآلي أجهزة الكمبيوتر التي تكتشف كيف يمكنها أداء المهام دون أن تتم برمجتها بشكل صريح للقيام بذلك. إنه يتضمن تعلم أجهزة الكمبيوتر من البيانات المقدمة حتى يتمكنوا من تنفيذ مهام معينة. بالنسبة للمهام البسيطة المخصصة لأجهزة الكمبيوتر ، من الممكن برمجة خوارزميات تخبر الجهاز بكيفية تنفيذ جميع الخطوات المطلوبة لحل المشكلة المطروحة ؛ من جانب الكمبيوتر ، ليست هناك حاجة للتعلم. بالنسبة للمهام الأكثر تقدمًا ، قد يكون من الصعب على الإنسان إنشاء الخوارزميات المطلوبة يدويًا. في الممارسة العملية ، يمكن أن يكون أكثر فاعلية لمساعدة الآلة على تطوير خوارزمية خاصة بها ، بدلاً من جعل المبرمجين البشريين يحددون كل خطوة مطلوبة.

يستخدم نظام التعلم الآلي مناهج مختلفة لتعليم أجهزة الكمبيوتر لإنجاز المهام التي لا تتوفر فيها خوارزمية مرضية تمامًا. في الحالات التي توجد فيها أعداد كبيرة من الإجابات المحتملة ، تتمثل إحدى الطرق في تصنيف بعض الإجابات الصحيحة على أنها صحيحة. يمكن بعد ذلك استخدام ذلك كبيانات تدريب للكمبيوتر لتحسين الخوارزمية التي يستخدمها لتحديد الإجابات الصحيحة. على سبيل المثال ، لتدريب نظام على مهمة التعرف على الأحرف الرقمية ، غالبًا ما يتم استخدام مجموعة بيانات MNIST للأرقام المكتوبة بخط اليد. كان الكتاب التمثيلي لبحوث التعلم الآلي خلال الستينيات هو كتاب نيلسون عن آلات التعلم ، ويتعامل في الغالب مع التعلم الآلي لتصنيف الأنماط. استمر الاهتمام بالتعرف على الأنماط في السبعينيات ، كما وصفه دودا وهارت في عام 1973. وفي عام 1981 ، تم تقديم تقرير عن استخدام استراتيجيات التدريس حتى تتعلم الشبكة العصبية التعرف على 40 حرفًا من محطة كمبيوتر.

قدم توم إم ميتشل تعريفًا رسميًا مقتبسًا على نطاق واسع للخوارزميات التي تمت دراستها في مجال التعلم الآلي: "يُقال أن برنامج الكمبيوتر يتعلم من التجربة E فيما يتعلق ببعض فئة المهام T وقياس الأداء P إذا كان أداءه في المهام في T ، كما تم قياسه بواسطة P ، يتحسن مع تجربة E. " يقدم هذا التعريف للمهام التي يتعلق بها التعلم الآلي تعريفًا تشغيليًا أساسيًا بدلاً من تعريف المجال من خلال المصطلحات المعرفية. يأتي هذا بعد اقتراح آلان تورينج في ورقته "الحوسبة الآلية والذكاء" ، حيث السؤال "هل يمكن للآلات أن تفكر؟" بالسؤال "هل يمكن للآلات أن تفعل ما يمكننا القيام به؟".

يحتوي التعلم الآلي الحديث على هدفين ، أحدهما هو تصنيف البيانات بناءً على النماذج التي تم تطويرها ، والغرض الآخر هو عمل تنبؤات للنتائج المستقبلية بناءً على هذه النماذج. قد تستخدم خوارزمية افتراضية خاصة بتصنيف البيانات رؤية الكمبيوتر للشامات إلى جانب التعلم الخاضع للإشراف من أجل تدريبها على تصنيف الشامات السرطانية. حيث يمكن لخوارزمية التعلم الآلي لتداول الأسهم إعلام المتداول بالتنبؤات المستقبلية المحتملة.

الذكاء الاصطناعي

كمحاولة علمية ، نشأ التعلم الآلي من السعي وراء الذكاء الاصطناعي. في الأيام الأولى للذكاء الاصطناعي كنظام أكاديمي ، كان بعض الباحثين مهتمين بتعلم الآلات من البيانات. لقد حاولوا التعامل مع المشكلة بأساليب رمزية مختلفة ، بالإضافة إلى ما كان يسمى آنذاك "الشبكات العصبية". كانت هذه في الغالب نماذج مدركة ونماذج أخرى تم اكتشافها لاحقًا على أنها إعادة اختراع للنماذج الخطية المعممة للإحصاءات. تم استخدام المنطق الاحتمالي أيضًا ، خاصة في التشخيص الطبي الآلي.

ومع ذلك ، تسبب التركيز المتزايد على النهج المنطقي القائم على المعرفة في حدوث شقاق بين الذكاء الاصطناعي والتعلم الآلي. ابتليت الأنظمة الاحتمالية بالمشكلات النظرية والعملية المتعلقة بالحصول على البيانات وتمثيلها. استمر العمل على التعلم الرمزي / القائم على المعرفة داخل الذكاء الاصطناعي ، مما أدى إلى البرمجة المنطقية الاستقرائية ، لكن الخط الإحصائي للبحث أصبح الآن خارج مجال الذكاء الاصطناعي المناسب ، في التعرف على الأنماط واسترجاع المعلومات. حيث تكون مجموعة فرعية "ذكية" فقط من ML جزءًا من الذكاء الاصطناعي.

أجاب جوديا بيرل على سؤال ما هو الفرق بين ML و AI في كتاب لماذا. وفقًا لذلك ، يتعلم التعلم الآلي ويتنبأ بناءً على الملاحظات السلبية ، بينما يشير الذكاء الاصطناعي إلى وجود عامل يتفاعل مع البيئة للتعلم واتخاذ الإجراءات التي تزيد من فرصته في تحقيق أهدافه بنجاح.

بيانات التعدين

غالبًا ما يستخدم التعلم الآلي واستخراج البيانات نفس الأساليب ويتداخلان بشكل كبير ، ولكن بينما يركز التعلم الآلي على التنبؤ ، بناءً على الخصائص المعروفة المكتسبة من بيانات التدريب ، يركز التنقيب في البيانات على اكتشاف الخصائص غير المعروفة في البيانات. يستخدم التنقيب عن البيانات العديد من أساليب التعلم الآلي ، ولكن بأهداف مختلفة ؛ من ناحية أخرى ، يستخدم التعلم الآلي أيضًا أساليب التنقيب عن البيانات مثل "التعلم غير الخاضع للإشراف" أو كخطوة معالجة مسبقة لتحسين دقة المتعلم. يأتي الكثير من الالتباس بين هذين المجتمعين البحثيين من الافتراضات الأساسية التي يعملان بها: في التعلم الآلي ، يتم عادةً تقييم الأداء فيما يتعلق بالقدرة على إعادة إنتاج المعرفة المعروفة ، بينما في اكتشاف المعرفة واستخراج البيانات المهمة الرئيسية هي اكتشاف معرفة غير معروفة سابقًا. نظرًا للتقييم فيما يتعلق بالمعرفة المعروفة ، فإن الطريقة غير المطلعة سوف يتفوق عليها بسهولة طرق أخرى خاضعة للإشراف ، بينما في مهمة KDD النموذجية ، لا يمكن استخدام الأساليب الخاضعة للإشراف بسبب عدم توفر بيانات التدريب.

الاقوي

يرتبط التعلم الآلي أيضًا بعلاقات وثيقة مع التحسين: تتم صياغة العديد من مشكلات التعلم كتقليل بعض وظائف الخسارة في مجموعة من الأمثلة التدريبية. تعبر وظائف الخسارة عن التناقض بين تنبؤات النموذج الذي يتم تدريبه وحالات المشكلة الفعلية.

تعميم

ينشأ الاختلاف بين التحسين والتعلم الآلي من هدف التعميم: في حين أن خوارزميات التحسين يمكن أن تقلل من الخسارة في مجموعة التدريب ، فإن التعلم الآلي يهتم بتقليل الخسارة في العينات غير المرئية. يعد توصيف تعميم خوارزميات التعلم المختلفة موضوعًا نشطًا للبحث الحالي ، خاصةً بالنسبة لخوارزميات التعلم العميق.

إحصائيات

يعد التعلم الآلي والإحصاء مجالين وثيقين الصلة من حيث الأساليب ، ولكنهما متميزان في هدفهما الرئيسي: تستمد الإحصائيات الاستدلالات السكانية من عينة ، بينما يجد التعلم الآلي أنماطًا تنبؤية قابلة للتعميم. وفقًا لمايكل جوردان ، فإن أفكار التعلم الآلي ، من المبادئ المنهجية إلى الأدوات النظرية ، لها تاريخ سابق طويل في الإحصاء. كما اقترح مصطلح علم البيانات كعنصر نائب لاستدعاء المجال العام. حيث يعني "النموذج الخوارزمي" أكثر أو أقل من خوارزميات التعلم الآلي مثل Random Forest.

اعتمد بعض الإحصائيين طرقًا من التعلم الآلي ، مما أدى إلى مجال مشترك يسمونه التعلم الإحصائي.

نظرية

الهدف الأساسي للمتعلم هو التعميم من تجربته. التعميم في هذا السياق هو قدرة آلة التعلم على الأداء بدقة في الأمثلة / المهام الجديدة غير المرئية بعد تجربة مجموعة بيانات التعلم. تأتي أمثلة التدريب من توزيع احتمالي غير معروف عمومًا ويتعين على المتعلم بناء نموذج عام حول هذا الفضاء يمكنه من إنتاج تنبؤات دقيقة بما فيه الكفاية في الحالات الجديدة.

يعد التحليل الحسابي لخوارزميات التعلم الآلي وأدائها فرعًا من فروع علوم الكمبيوتر النظرية المعروفة باسم نظرية التعلم الحسابي. نظرًا لأن مجموعات التدريب محدودة والمستقبل غير مؤكد ، فإن نظرية التعلم عادة لا تعطي ضمانات لأداء الخوارزميات. بدلاً من ذلك ، الحدود الاحتمالية على الأداء شائعة جدًا. يعتبر تحلل التحيز والتباين أحد الطرق لتقدير خطأ التعميم.

للحصول على أفضل أداء في سياق التعميم ، يجب أن يتطابق تعقيد الفرضية مع تعقيد الوظيفة التي تقوم عليها البيانات. إذا كانت الفرضية أقل تعقيدًا من الوظيفة ، فحينئذٍ يكون النموذج قد احتوى على البيانات. إذا زاد تعقيد النموذج استجابةً لذلك ، ينخفض ​​خطأ التدريب. ولكن إذا كانت الفرضية معقدة للغاية ، فسيكون النموذج عرضة للإفراط في التجهيز وسيكون التعميم أكثر فقراً.

بالإضافة إلى حدود الأداء ، يدرس منظرو التعلم التعقيد الزمني وجدوى التعلم. في نظرية التعلم الحسابي ، تعتبر العملية الحسابية ممكنة إذا كان من الممكن إجراؤها في وقت متعدد الحدود. هناك نوعان من نتائج تعقيد الوقت. تظهر النتائج الإيجابية أنه يمكن تعلم فئة معينة من الوظائف في وقت كثير الحدود. تظهر النتائج السلبية أنه لا يمكن تعلم فئات معينة في وقت كثير الحدود.

اقتراب

تنقسم مناهج التعلم الآلي تقليديًا إلى ثلاث فئات عريضة ، اعتمادًا على طبيعة "الإشارة" أو "التعليقات" المتاحة لنظام التعلم:

التعلم الخاضع للإشراف: يتم تقديم الكمبيوتر مع أمثلة المدخلات والمخرجات المرغوبة ، التي يقدمها "المعلم" ، والهدف هو تعلم قاعدة عامة تحدد المدخلات إلى المخرجات.

التعلم غير الخاضع للإشراف: لا يتم إعطاء تسميات لخوارزمية التعلم ، مما يتركها بمفردها لإيجاد بنية في مدخلاتها. يمكن أن يكون التعلم غير الخاضع للإشراف هدفًا في حد ذاته أو وسيلة لتحقيق غاية.

التعلم المعزز: يتفاعل برنامج الكمبيوتر مع بيئة ديناميكية يجب أن يؤدي فيها هدفًا معينًا. أثناء التنقل في مساحة المشكلة ، يتم تزويد البرنامج بتعليقات مماثلة للمكافآت ، والتي يحاول تعظيمها. تُعرف البيانات باسم بيانات التدريب ، وتتكون من مجموعة من أمثلة التدريب. يحتوي كل مثال تدريبي على واحد أو أكثر من المدخلات والمخرجات المرغوبة ، والمعروفة أيضًا باسم الإشارة الإشرافية. في النموذج الرياضي ، يتم تمثيل كل مثال تدريبي بمصفوفة أو متجه ، يُطلق عليه أحيانًا متجه الميزة ، ويتم تمثيل بيانات التدريب بواسطة مصفوفة. من خلال التحسين التكراري لوظيفة موضوعية ، تتعلم خوارزميات التعلم الخاضع للإشراف وظيفة يمكن استخدامها للتنبؤ بالمخرجات المرتبطة بالمدخلات الجديدة. ستسمح الوظيفة المثلى للخوارزمية بتحديد مخرجات المدخلات التي لم تكن جزءًا من بيانات التدريب بشكل صحيح. يقال إن الخوارزمية التي تعمل على تحسين دقة مخرجاتها أو تنبؤاتها بمرور الوقت قد تعلمت أداء هذه المهمة. تُستخدم خوارزميات التصنيف عندما تقتصر النواتج على مجموعة محدودة من القيم ، وتُستخدم خوارزميات الانحدار عندما يكون للمخرجات أي قيمة عددية ضمن النطاق. على سبيل المثال ، بالنسبة لخوارزمية التصنيف التي تقوم بتصفية رسائل البريد الإلكتروني ، سيكون الإدخال بريدًا إلكترونيًا واردًا ، وسيكون الناتج هو اسم المجلد الذي سيتم إرسال البريد الإلكتروني فيه.

تعلم التشابه هو مجال من مجالات التعلم الآلي الخاضع للإشراف والذي يرتبط ارتباطًا وثيقًا بالانحدار والتصنيف ، ولكن الهدف هو التعلم من الأمثلة باستخدام وظيفة التشابه التي تقيس مدى تشابه أو ارتباط كائنين. لديها تطبيقات في الترتيب وأنظمة التوصية وتتبع الهوية المرئية والتحقق من الوجه والتحقق من المتحدث.

تعليم غير مشرف عليه

تأخذ خوارزميات التعلم غير الخاضعة للإشراف مجموعة من البيانات التي تحتوي فقط على المدخلات ، وتجد بنية في البيانات ، مثل تجميع أو تجميع نقاط البيانات. لذلك ، تتعلم الخوارزميات من بيانات الاختبار التي لم يتم تصنيفها أو تصنيفها أو تصنيفها. بدلاً من الاستجابة للتعليقات ، تحدد خوارزميات التعلم غير الخاضعة للإشراف القواسم المشتركة في البيانات وتتفاعل بناءً على وجود أو عدم وجود مثل هذه القواسم المشتركة في كل جزء جديد من البيانات. يوجد تطبيق مركزي للتعلم غير الخاضع للإشراف في مجال تقدير الكثافة في الإحصاء ، مثل إيجاد دالة كثافة الاحتمال. على الرغم من أن التعلم غير الخاضع للإشراف يشمل مجالات أخرى تتضمن تلخيص وشرح ميزات البيانات.

تحليل الكتلة هو تخصيص مجموعة من الملاحظات في مجموعات فرعية بحيث تكون الملاحظات داخل نفس المجموعة متشابهة وفقًا لمعيار واحد أو أكثر من المعايير المحددة مسبقًا ، في حين تختلف الملاحظات المستمدة من مجموعات مختلفة. تضع تقنيات التجميع المختلفة افتراضات مختلفة حول بنية البيانات ، غالبًا ما يتم تحديدها بواسطة بعض مقاييس التشابه ويتم تقييمها ، على سبيل المثال ، من خلال الانضغاط الداخلي ، أو التشابه بين أعضاء نفس المجموعة ، والفصل ، الفرق بين المجموعات. تعتمد الطرق الأخرى على الكثافة المقدرة واتصال الرسم البياني.

التعلم شبه تحت الإشراف

يقع التعلم شبه الخاضع للإشراف بين التعلم غير الخاضع للإشراف والتعلم الخاضع للإشراف. تفتقد بعض الأمثلة التدريبية إلى تسميات التدريب ، ومع ذلك فقد وجد العديد من الباحثين في مجال التعلم الآلي أن البيانات غير المصنفة ، عند استخدامها بالاقتران مع كمية صغيرة من البيانات المصنفة ، يمكن أن تؤدي إلى تحسن كبير في دقة التعلم.

في التعلم الخاضع للإشراف الضعيف ، تكون ملصقات التدريب صاخبة أو محدودة أو غير دقيقة ؛ ومع ذلك ، غالبًا ما يكون الحصول على هذه الملصقات أرخص ، مما يؤدي إلى مجموعات تدريب فعالة أكبر.

تعزيز التعلم

التعلم المعزز هو مجال من مجالات التعلم الآلي يهتم بكيفية قيام وكلاء البرمجيات باتخاذ إجراءات في بيئة ما من أجل تعظيم فكرة المكافأة التراكمية. نظرًا لعموميتها ، تتم دراسة المجال في العديد من التخصصات الأخرى ، مثل نظرية اللعبة ، ونظرية التحكم ، وبحوث العمليات ، ونظرية المعلومات ، والتحسين القائم على المحاكاة ، والأنظمة متعددة العوامل ، وذكاء السرب ، والإحصاءات ، والخوارزميات الجينية. في التعلم الآلي ، يتم تمثيل البيئة عادةً كعملية قرار ماركوف. تستخدم العديد من خوارزميات التعلم المعزز تقنيات البرمجة الديناميكية. لا تفترض خوارزميات التعلم المعزز معرفة النموذج الرياضي الدقيق لـ MDP ، ويتم استخدامها عندما تكون النماذج الدقيقة غير قابلة للتطبيق. تُستخدم خوارزميات التعلم المعزز في المركبات ذاتية القيادة أو في تعلم لعب لعبة ضد خصم بشري.

تخفيض الأبعاد

تقليل الأبعاد هو عملية تقليل عدد المتغيرات العشوائية قيد الدراسة من خلال الحصول على مجموعة من المتغيرات الرئيسية. بمعنى آخر ، إنها عملية لتقليل أبعاد مجموعة الميزات الخاصة بك ، والتي تسمى أيضًا "عدد الميزات". يمكن اعتبار معظم تقنيات تقليل الأبعاد إما إزالة الميزة أو الاستخراج.

أحد الأساليب الشائعة لتقليل الأبعاد هو تحليل المكون الرئيسي.

تحليل المكون الرئيسي

يتضمن PCA تغيير البيانات ذات الأبعاد الأعلى إلى مساحة أصغر. ينتج عن هذا بُعد أصغر للبيانات ، مع الاحتفاظ بجميع المتغيرات الأصلية في النموذج دون تغيير البيانات.

أنواع أخرى

تم تطوير مناهج أخرى لا تتناسب تمامًا مع هذا التصنيف ثلاثي الأبعاد ، وفي بعض الأحيان يتم استخدام أكثر من واحد بواسطة نفس نظام التعلم الآلي. على سبيل المثال نمذجة الموضوع ، التعلم التلوي.

اعتبارًا من عام 2020 ، أصبح التعلم العميق هو النهج السائد لكثير من العمل المستمر في مجال التعلم الآلي. إنه تعلم بدون مكافآت خارجية ولا مشورة خارجية من المعلم. تحسب خوارزمية التعلم الذاتي CAA ، بطريقة العارضة ، كلاً من القرارات المتعلقة بالأفعال والعواطف حول مواقف العواقب. النظام مدفوع بالتفاعل بين الإدراك والعاطفة.

تقوم خوارزمية التعلم الذاتي بتحديث مصفوفة الذاكرة W بحيث يتم تنفيذ روتين التعلم الآلي التالي في كل تكرار:

في حالة القيام بعمل أ ؛

تلقي حالة العواقب ؛

حساب عاطفة الوجود في حالة التبعية v ؛

تحديث ذاكرة العارضة باستخدام w 'w + v.

إنه نظام به مدخل واحد فقط ، ومواقف ، ومخرج واحد فقط ، وهو الإجراء أ. لا يوجد مدخل تعزيز منفصل ولا مدخلات مشورة من البيئة. القيمة backpropagated هي العاطفة تجاه حالة العواقب. يوجد CAA في بيئتين ، أحدهما هو البيئة السلوكية حيث يتصرف ، والآخر هو البيئة الجينية ، حيث من البداية يتلقى مرة واحدة فقط المشاعر الأولية حول المواقف التي يجب مواجهتها في البيئة السلوكية. بعد تلقي ناقل الجينوم من البيئة الجينية ، تتعلم هيئة الطيران المدني سلوكًا يسعى إلى تحقيق الهدف ، في بيئة تحتوي على مواقف مرغوبة وغير مرغوب فيها.

ميزة التعلم

تهدف العديد من خوارزميات التعلم إلى اكتشاف تمثيلات أفضل للمدخلات المقدمة أثناء التدريب. تشمل الأمثلة الكلاسيكية تحليل المكونات الرئيسية وتحليل الكتلة. غالبًا ما تحاول خوارزميات تعلم الميزات ، والتي تسمى أيضًا خوارزميات التعلم التمثيلية ، الحفاظ على المعلومات في مدخلاتها ولكن أيضًا تحويلها بطريقة تجعلها مفيدة ، غالبًا كخطوة معالجة مسبقة قبل إجراء التصنيف أو التنبؤات. تسمح هذه التقنية بإعادة بناء المدخلات القادمة من التوزيع غير المعروف لتوليد البيانات ، بينما لا تكون بالضرورة وفية للتكوينات التي لا يمكن تصديقها في ظل هذا التوزيع. يحل هذا محل هندسة الميزات اليدوية ، ويسمح للآلة بتعلم الميزات واستخدامها لأداء مهمة محددة.

يمكن أن يكون تعلم الميزة خاضعًا للإشراف أو غير خاضع للإشراف. في تعلم الميزات الخاضع للإشراف ، يتم تعلم الميزات باستخدام بيانات الإدخال المصنفة. تشمل الأمثلة الشبكات العصبية الاصطناعية ، والمدارك متعددة الطبقات ، وتعلم القاموس تحت الإشراف. في تعلم الميزات غير الخاضع للإشراف ، يتم التعرف على الميزات ببيانات الإدخال غير المسماة. تتضمن الأمثلة تعلم القاموس ، وتحليل المكونات المستقلة ، والتشفير التلقائي ، وعوامل المصفوفة وأشكال مختلفة من التجميع.

تحاول خوارزميات التعلم المتشعبة القيام بذلك في ظل القيد بأن التمثيل الذي تم تعلمه منخفض الأبعاد. تحاول خوارزميات الترميز المتفرقة القيام بذلك في ظل القيد بأن التمثيل الذي تم تعلمه ضئيل ، مما يعني أن النموذج الرياضي يحتوي على العديد من الأصفار. تهدف خوارزميات تعلم الفضاء الجزئي متعدد الخطوط إلى تعلم التمثيلات منخفضة الأبعاد مباشرة من تمثيلات الموتر للبيانات متعددة الأبعاد ، دون إعادة تشكيلها في ناقلات ذات أبعاد أعلى. تكتشف خوارزميات التعلم العميق مستويات متعددة من التمثيل ، أو تسلسل هرمي للميزات ، بمستوى أعلى ، وميزات أكثر تجريدية محددة من حيث ميزات المستوى الأدنى. لقد قيل أن الآلة الذكية هي التي تتعلم التمثيل الذي يفكك تشابك العوامل الأساسية للتباين التي تشرح البيانات المرصودة.

يتم تحفيز تعلم الميزات من خلال حقيقة أن مهام التعلم الآلي مثل التصنيف تتطلب في كثير من الأحيان إدخالًا مناسبًا للعملية من الناحية الحسابية والرياضية. ومع ذلك ، فإن بيانات العالم الحقيقي مثل الصور ومقاطع الفيديو والبيانات الحسية لم تسفر عن محاولات لتعريف خوارزميات معينة لميزات معينة. البديل هو اكتشاف مثل هذه الميزات أو التمثيلات من خلال الفحص ، دون الاعتماد على خوارزميات صريحة.

تعلم القاموس المتفرق

تعلم القاموس المتفرق هو طريقة تعلم ميزة حيث يتم تمثيل مثال التدريب كمجموعة خطية من الوظائف الأساسية ، ويفترض أن يكون مصفوفة متفرقة. هذه الطريقة صعبة للغاية ويصعب حلها تقريبًا. طريقة الكشف عن مجريات الأمور الشائعة لتعلم القواميس المتفرقة هي خوارزمية K-SVD. تم تطبيق تعلم القاموس المتفرق في سياقات عديدة. في التصنيف ، تكمن المشكلة في تحديد الفئة التي ينتمي إليها مثال تدريب غير مرئي سابقًا. بالنسبة إلى القاموس الذي تم فيه إنشاء كل فصل بالفعل ، يتم ربط مثال تدريب جديد بالفصل الذي يتم تمثيله بشكل متناثر بواسطة القاموس المقابل. كما تم تطبيق تعلم القاموس المتفرق في إزالة الضوضاء من الصورة. الفكرة الأساسية هي أن تصحيح الصورة النظيفة يمكن تمثيله بشكل ضئيل بواسطة قاموس الصور ، لكن لا يمكن للضوضاء.

إكتشاف عيب خلقي

في التنقيب عن البيانات ، يعد اكتشاف الشذوذ ، المعروف أيضًا باسم الاكتشاف الخارجي ، هو تحديد العناصر أو الأحداث أو الملاحظات النادرة التي تثير الشكوك من خلال الاختلاف بشكل كبير عن غالبية البيانات. عادةً ما تمثل العناصر الشاذة مشكلة مثل الاحتيال المصرفي أو عيب هيكلي أو مشكلات طبية أو أخطاء في النص. يشار إلى الحالات الشاذة على أنها القيم المتطرفة ، والمستجدات ، والضوضاء ، والانحرافات والاستثناءات.

على وجه الخصوص ، في سياق الكشف عن إساءة الاستخدام والتطفل على الشبكة ، غالبًا ما لا تكون الكائنات المثيرة للاهتمام كائنات نادرة ، ولكنها دفعات غير متوقعة من الخمول. لا يلتزم هذا النمط بالتعريف الإحصائي الشائع للعناصر الخارجية ككائن نادر ، وستفشل العديد من طرق الكشف الخارجة في مثل هذه البيانات ما لم يتم تجميعها بشكل مناسب. بدلاً من ذلك ، قد تكون خوارزمية تحليل الكتلة قادرة على اكتشاف المجموعات الصغيرة التي تشكلها هذه الأنماط.

توجد ثلاث فئات واسعة من تقنيات الكشف عن الشذوذ. تكتشف تقنيات اكتشاف الشذوذ غير الخاضعة للإشراف الحالات الشاذة في مجموعة بيانات الاختبار غير المسماة على افتراض أن غالبية الحالات في مجموعة البيانات طبيعية ، من خلال البحث عن الحالات التي يبدو أنها تتلاءم بشكل أقل مع بقية مجموعة البيانات. تتطلب تقنيات الكشف عن الشذوذ الخاضع للإشراف مجموعة بيانات تم تصنيفها على أنها "طبيعية" و "غير طبيعية" وتتضمن تدريب المصنف. تُنشئ تقنيات الكشف عن الشذوذ الخاضع للإشراف نموذجًا يمثل السلوك الطبيعي من مجموعة بيانات تدريب عادية معينة ، ثم تختبر احتمالية إنشاء مثيل اختبار بواسطة النموذج.

تعلم الروبوت

في الروبوتات التنموية ، تولد خوارزميات تعلم الروبوت تسلسلها الخاص من خبرات التعلم ، والمعروف أيضًا باسم المناهج الدراسية ، لاكتساب مهارات جديدة بشكل تراكمي من خلال الاستكشاف الموجه ذاتيًا والتفاعل الاجتماعي مع البشر. تستخدم هذه الروبوتات آليات توجيه مثل التعلم النشط والنضج والتآزر الحركي والتقليد.

قواعد الرابطة

تعلم قواعد الرابطة هو أسلوب تعلم آلي قائم على القواعد لاكتشاف العلاقات بين المتغيرات في قواعد البيانات الكبيرة. الغرض منه هو تحديد القواعد القوية المكتشفة في قواعد البيانات باستخدام بعض مقاييس "الاهتمام".

التعلم الآلي القائم على القواعد هو مصطلح عام لأي طريقة تعلم آلي تحدد "القواعد" أو تتعلمها أو تطورها لتخزين المعرفة أو معالجتها أو تطبيقها. السمة المميزة لخوارزمية التعلم الآلي القائمة على القواعد هي تحديد واستخدام مجموعة من القواعد العلائقية التي تمثل بشكل جماعي المعرفة التي يلتقطها النظام. هذا على عكس خوارزميات التعلم الآلي الأخرى التي تحدد عادةً نموذجًا فرديًا يمكن تطبيقه عالميًا على أي حالة من أجل إجراء تنبؤ. تتضمن مناهج التعلم الآلي القائمة على القواعد أنظمة تصنيف التعلم وتعلم قواعد الجمعيات وأنظمة المناعة الاصطناعية.

استنادًا إلى مفهوم القواعد القوية ، قدم راكيش أغراوال وتوماس إيميلينسكي وأرون سوامي قواعد الارتباط لاكتشاف الانتظام بين المنتجات في بيانات المعاملات واسعة النطاق المسجلة بواسطة أنظمة نقاط البيع في محلات السوبر ماركت. على سبيل المثال ، تشير القاعدة \ الموجودة في بيانات مبيعات السوبر ماركت إلى أنه إذا اشترى العميل البصل والبطاطس معًا ، فمن المحتمل أيضًا أن يشتري لحم الهامبرغر. يمكن استخدام هذه المعلومات كأساس لاتخاذ قرارات بشأن الأنشطة التسويقية مثل التسعير الترويجي أو مواضع المنتجات. بالإضافة إلى تحليل سلة السوق ، يتم استخدام قواعد الارتباط اليوم في مجالات التطبيق بما في ذلك التنقيب عن استخدام الويب ، وكشف التسلل ، والإنتاج المستمر ، والمعلوماتية الحيوية. على عكس التعدين المتسلسل ، لا يأخذ تعلم قواعد الارتباط عادةً في الاعتبار ترتيب العناصر سواء داخل المعاملة أو عبر المعاملات.

أنظمة تصنيف التعلم هي مجموعة من خوارزميات التعلم الآلي القائمة على القواعد والتي تجمع بين مكون الاكتشاف ، عادةً خوارزمية جينية ، مع مكون تعليمي ، تؤدي إما التعلم الخاضع للإشراف ، أو التعلم المعزز ، أو التعلم غير الخاضع للإشراف. إنهم يسعون إلى تحديد مجموعة من القواعد التي تعتمد على السياق والتي تقوم بشكل جماعي بتخزين المعرفة وتطبيقها بطريقة متعددة الأجزاء من أجل إجراء تنبؤات.

البرمجة المنطقية الاستقرائية هي نهج لتعلم القواعد باستخدام البرمجة المنطقية كتمثيل موحد لأمثلة المدخلات والمعرفة الأساسية والفرضيات. بالنظر إلى ترميز المعرفة الخلفية المعروفة ومجموعة من الأمثلة الممثلة كقاعدة بيانات منطقية للحقائق ، سيشتق نظام ILP برنامج منطق مفترض يتضمن جميع الأمثلة الإيجابية وغير السلبية. البرمجة الاستقرائية هي مجال ذو صلة يأخذ في الاعتبار أي نوع من لغات البرمجة لتمثيل الفرضيات ، مثل البرامج الوظيفية.

تعد برمجة المنطق الاستقرائي مفيدة بشكل خاص في المعلوماتية الحيوية ومعالجة اللغة الطبيعية. وضع جوردون بلوتكين وإيهود شابيرو الأساس النظري الأولي للتعلم الآلي الاستقرائي في بيئة منطقية. بنى شابيرو أول تطبيق له في عام 1981: برنامج Prolog الذي استنتج بشكل استقرائي برامج المنطق من الأمثلة الإيجابية والسلبية. يشير المصطلح الاستقرائي هنا إلى الاستقراء الفلسفي ، مما يشير إلى نظرية لشرح الحقائق المرصودة ، بدلاً من الاستقراء الرياضي ، مما يثبت خاصية لجميع أعضاء مجموعة جيدة الترتيب.

تقييم:

تعليقات