بحث مخصص من جوجل فى أوفيسنا
![]()
Custom Search
|
تطبيق أورانج لتحليل البيانات - الدرس الأول
-
Similar Content
-
By محمد طاهر
أولا وصلة الدروس السابقة:
تطبيق أورانج لتحليل البيانات - الدرس الأول
تطبيق أورانج لتحليل البيانات - الدرس الثاني
أهلا بكم في الدرس الثالث
اليوم سنستعرض بعض المكونات الإضافية (Widgets) ووسائط الاتصال (Communication Channels)
وقبل ان نبدأ لنتذكر سويا بعض المصطلحات من الدروس السابقة
· مكون: Widget
· مجموعة:Group
· قناة اتصال: Communication Channel
· مسار التدفق: Workflow
والمسار التدفق هو عبارة عن المكونات وقنوات الاتصال التي تظهر في لوحة التصميم
وذلك كما يوضح الشكل التالي
ونلاحظ انه في حالة ان يصبح مسار التدفق معقدا ويحتاج لمساحة كبيرة لترتيبه بطريفة مناسبة، يمكننا ان نقلص المساحة المخصص للمجموعات وذلك بالضغط على
View
Expand Tool Doc
او الضعط على
CTR+Shift+D
فيتم تقليص المساحة كما يظهر في الشكل التالي
ولاعادة المجموعات لوضعها الأصلي، نكرر نفس الخطوات او نضغط
CTR+Shift+D
مرة أخرى
ويمكن إبقاء المجموعات في الوضع المتقلص باستمرار واستخدام زر الماوس الأيمن لاضافة المكونات
والان سنقوم بإضافة مكون ملف جديد وستخدام نفس قاعدة البيانات الخاصة بزهرة السوسن IRIS
ونضيف مخطط تشتت Scater Plot وجدول بيانات ونصل كل من مكون الملف مع كل من مكون مخطط التشتت وجدول البيانات
ولننقر مرتين على من مخطط التشتت وجدول البيانات لنتأكد أولا بان البينات مقروءة بصورة جيدة
والان لنربط مخطط التشتت مع جدول البيانات
وسنجد ان قناة الاتصال بينهما قد ظهرت عليها عبارة مختلف عن كل ما سبق
فقد كانت العبارة المعتادة هي Data
اما الان فتظهر عبارة
Selected Data – Data subset
ولكن ماذا يعني ذلك ؟
لتوضيح الامر
لنختار مجموعة سجلات من جدول البيانات، سنجد أن ذلك ينتج عنه اختيار النقاط المناظرة في مخطط التشتت
وبذلك نكون قد أنشأنا متصفح مرئي للبيانات Visual Data Browser
والان لننقر مرتين على قناة الاتصال بين جدول البيانات ومخطط التشتت
سنجد أن البرنامج قد استنتج بالفعل أن العلاقة هي علاقة بين مجموعة بيانات (مختارة) من الجدول، واهرى مختارة من مخطط التشتت
ويمكننا نغيير ذلك بان نقوم أولا بحذف العلاقة الموجودة
و يتم حذف اي علاقة بالنقر عليها
ثم نختار العلاقة بين
Data and Data subset
و نلاحظ ان الاختيار يكون بالضغط على زر الماوس الايسر و الاستمرار فى الضغط مع السحب الي حين الوصول لمربع الوجهة
وسنجد أن مخطط التشتت يظهر كافة البيانات بنفس الطريقة ( كلها مختارة) بصرف النظر عن وجود سجلات مختارة من الجدول، أي لا يميز البيانات المختارة كما كان فى الحالة السابقة
الحالة الثالثة : اما اذا اخترنا ربط Data ب Data فستظهر كافة البيانات دون اختيار اي منها بصرف النظر عن اختيار السجلات فى الجدول
الحالة الرابعة ، هي ان نربط Selected Data ب Data
و هنا سيظهر فى المخطط فقط البيانات المختارة
و هذه هي كل الحالات المتاحة ، جيث لن يسمج البرنامج فى حالة هذا المثال بالربط مع Feature و التي سنتطرق اليها لاحقا فى دروس اخرى.
و نحن عادة لانحتاج القيام بما سبق كثيرا ، حيث يتعرف البرنامج على نوعية البيانات المطلوب ربطها بصورة صحيح عند انشاء قناة الاتصال بين مكونين.
و هكذا عند الرغبة في إزالة أي قناة اتصال ننقر عليها فيتم ازالتها بسهولة و ذلك باختيارها بالزر الأيمن ثم اختيار
Remove
وهكذا نكون استعرضنا كيفية إنشاء قنوات الاتصال ببين المكونات
و بذلك نصل الى نهاية الدرس الثالث
مرفق ملف الاورانج
Lesson _3.rar
-
By محمد طاهر
فهرس دورة الأورانج
تحميل تطبيق أورانج
تطبيق أورانج لتحليل البيانات - الدرس الأول
تطبيق أورانج لتحليل البيانات - الدرس الثاني
تطبيق أورانج لتحليل البيانات - الدرس الثالث
-
By محمد طاهر
تعلم أساسيات تطبيق أورانج – الدرس الثاني
السلام عليكم
في الدرس السابق تعرفنا إلى كيفية إضافة المكونات Widgets إلى لوحة التصميم وربطها واستعراض البيانات كجداول وكرسم بياني. بما يمثل اول مسار تدفقي لنا في هذه السلسلة من الدروس
الدرس الأول : من هنا
اليوم سنكمل رحلتنا مع أساسيات الأورانج و سنبدأ من حيث انتهينا فى الدرس السابق اي اننا لدينا ملف به بالفعل المسار التدفقي الذي تم تصميمه في الدرس السابق. أي سنقوم بإضافة مكون File وربطه بقاعدة بيانات IRIS و إضافة مكون Data Table و ربطهما و استعراض البيانات
ليظهر الشكل كما يلي:
و كما اتفقتا في الدرس الماضي ، أن هذه البيانات تمثل الطول و العرض لكل من الأوراق الملونة Petal و الأوراق الخضراء الخارجية Sepal لمجموعة من زهرات السوسن و يمثل الحقل IRIS احد الأنواع الفرعية لزهرة السوسن
· IRIS-Setosa
· IRIS-Versiolor
· IRIS-Virginica
و الان لنستعرض توزيع هذه الخصائص عن طريق مكون (Widget) المسمي Distribution
و لنري الان طريقة رابعة لاضافة المكون ، بالإضافة الي الثلاث طرق التي درسناها في الدرس الماضي
لنسحب الاطار الخارجي لمكون ملف ، و سنجد أن البرنامج يقترح علينا عدد من المكونات الملائمة ، فى نهاية قناة الاتصال و اذا بدانا في كتابة الاحرف فانه يقوم بفلترة الخيارات كما توضح الصورة التالية ، و عليه لنختار مكون Disctribution
و في البرنامج يطلق مصطلح قناة الاتصال على الخط الواصل بين المكونات
Communication Channel
و البرنامج لا يستمح باضافة مكون فى نهاية قناة الاتصال غير متوافق مع المكون الموجود فى بداية الخط
و بالنقر علي مكون Distribution سنجد التوزيع الخاص بكل من هذه الخصائصو يمكنك استعراض توزيع كل من الخصائص باختبارها من مجموعة المتغيرات على يسار الشاشة Varriables
و لمزيد من توضيح مكونات البيانات ، لنضيف مكون مخطط التشتت Scatter plot كما فعلنا في الدرس الأول
و لكن هذا المخطط بالوضع الحالي لا يعطي معلومة مفيدة ، حيث أن التداخل بين الأنواع الثلاثة لزهرة السوسن لا يبدو جليا ، و لذلك نضغط على خيار
Find Informative project
و الذي يوضح لنا افضل العلاقات بين المتغيرات التي تعطي علاقة واضحة و نختار مثلا العلاقة بين طول و عرض الأوراق الملونة Petal
و نلاحظ أن الخيارات مرتبة ترتيب الافضلية فى اضظهار المعلومات المفيدة و يوضح ذلك الخط البرتقالي اسفل كل خيار
و عليه سيظهر لنا رسم يوضح تصنيفات الازهار الثلاثة بطريقة واضحة اعتمادا على متغير طول و عرض الورقة Petal Lenght adn Width بحيث تظهر ان اقلها ابعادا هي ال
· IRIS-Setosa
و التي تظهر باللون الازرق
و اكبرها ابعادا هي ال
· IRIS-Virginica
و التي تظهر باللون الاخضر
و بذلك يعطينا المخطط مفهوم واضح لاحدى المعلومات الموجودة فى قاعد البيانات
كما يظهر وجود تداخل بين ابعاد
· IRIS-Versiolor
· IRIS-Virginica
و للتاكد من المعلومة ( أي وجود تماثل بين بعض ابعاد هذين النوعين)
لنختار بعض نقاط التماس بينها
و ستظهر هذه النقاط معلمة في المخطط
و الان لنضيف مكون Data Table إضافي ليظهر لنا هذه النقاط المختارة لنتحقق من بياناتها
و لنضغط على المكون المضاف أخيرا ، ليظهر لنا فقط بيانات النقاط المختارة في المخطط
أي ان الاختيارات في المكونات تظهر اليا في المكونات المرتبطة و هذه خاصية من الخصائص المفيدة التي سنستخدمها كثيرا
و بمراجعة بيانات النقاط المختارة ، نجد أنها فعلا تخص النوعين المذكورين و ان بياناتها متقاربة
و سنلاظ أيضا انه كلما غيرنا النقاط المختارة فى مخطط التشتت ، تغيرت البيانات فى هذا الجدول الاخير لتعكس الاختيار
و هكذا نصل الي نهاية الدرس الثاني
مرفق الملف الخاص بالمثال
Lessons 02 .rar
الدرس الثالث من هنا
-
By محمد طاهر
السلام عليكم
تواكبا مع متطلبات الواقع و المستقبل ، تم افتتاح مجموعة أقسام جديدة تختص بالبحث العلمي و علوم البيانات
و من ضمنها هذا القسم ، و هو يختص بالمواضيع الخاصة بالذكاء الاصطناعي Artificial Interlligence و التنقيب فى البيانات Data Mining
نذكر الزوار الجدد بقواعد المشاركة فى منتدى أوفيسنا ، و من أهمها احترام حقوق الملكية الفكرية و منع نشر أي مواد أو تطبيقات دون موافقة أصحابها.
-
By Dr. Khalid Hamdy
اخترت أسلوبين لتحليل البيانات لشرحهما والمقارنة بنيهما، والأسلوبين هما التجميع Clustering والتصنيف Classification، والسبب لاختياري هذين الأسلوبين أنني كنت محتار تماما في الفرق بينهما، وبالتالي قرأت عنهما الكثير وتوصلت لفهم بسيط لكل منهما والفرق الأساسي بينهما، ولكي أشرحهما سأقوم باستعراض مثال بسيط معكم.
تخيل أنك لا تعرف شيء عن المركبات أو السيارات، وتم إعطائك مجموعة كبيرة من البيانات Big Data عن المركبات التي تسير في شوارع مدينتك، وكانت هذه البيانات في صورة جدول يتضمن سعة المحرك باللتر، والزمن الذي تستغرقه المركبة للوصول إلى سرعة 100 كيلومتر/الساعة بالثانية، كما يوضح الرسم البياني أدناه
تذكر أنك لا تعرف شيء عن المركبات، ولا تستطيع أن تحدد نوع المركبة، أو حجمها من البيانات المتاحة، ولكن مطلوب منك تحليل البيانات ومحاولة إيجاد علاقات منطقية بينها.
هل تستخدم التجميع Clustering أم التصنيف Classification ؟ من المنطقي في هذه الحالة ألا تحاول استخدام التصنيف، فأنت لا تعرف الأصناف الموجودة ومواصفات كل منها، وهذه هي نفس المشكلة التي سيواجهها جهاز الحاسب الآلي الذي يستطيع معالجة البيانات بسرعة ولكن ليس لديه فهم مسبق عن ماهية البيانات.
وبالتالي يصبح حتميا استخدام التجميع Clustering، وهو عبارة عن تجميع البيانات القريبة من بعضها البعض في مجموعة واحدة Cluster، وإيجاد المتوسط الحسابي لها بحيث تكون النقاط المشمولة في المجموعة أقرب للمتوسط الحسابي للمجموعة الخاصة بها من المتوسط الحسابي لأي مجموعة أخرى، كما يوضح الشكل أدناه.
والسؤال الآن، ما الذي استفدناه من هذا التجميع؟ دعونا أولا نسجل بعض الملاحظات عن المجموعات الأربعة التي ظهرت لدينا:
- المجموعة 1 تتضمن أكبر عدد من النقاط وتتميز بانخفاض سعة المحرك وارتفاع زمن الوصول إلى 100 كيلومتر/الساعة (أي انخفاض القدرة على التسارع)
- المجموعة 2 تتضمن تقريبا أقل عدد من النقاط وتتميز بارتفاع سعة المحرك وانخفاض زمن الوصول إلى 100 كيلومتر/الساعة (أي ارتفاع القدرة على التسارع)
- المجموعة 3 تتضمن عدد قليل من النقاط وتتميز بانخفاض سعة المحرك وانخفاض زمن الوصول إلى 100 كيلومتر/الساعة (أي ارتفاع القدرة على التسارع)
- المجموعة 4 تتضمن عدد متوسط من النقاط وتتميز بارتفاع سعة المحرك وارتفاع زمن الوصول إلى 100 كيلومتر/الساعة (أي انخفاض القدرة على التسارع)
دعونا نقوم بتحليل هذه النتائج من وجهة النظر المنطقية:
نفترض الآن أنك تريد أن تفهم أسباب منطقية وعدم منطقية النتائج، طبعا ستلجأ لصديق يفهم جيدا في أنواع المركبات وأصنافها، وسيكون رده في الغالب كما يلي:
· المجموعة 1 ذات سعة المحرك المنخفضة والتسارع المنخفض هي السيارات العادية Passenger Vehicles
· المجموعة 2 ذات سعة المحرك المرتفعة والتسارع المرتفع هي السيارات الرياضية Sports Cars
· المجموعة 3 ذات سعة المحرك المنخفضة والتسارع المرتفعة هي الدراجات النارية Motor Cycles
· المجموعة 4 ذات سعة المحرك المرتفعة والتسارع المنخفض هي الشاحنات Trucks
إذن التجميع لا يبدأ بتصنيفات محددة ولكنه يصل إلى الأصناف من خلال التجميع والتحليل، وطبعا في هذا المثال لم نصل إلى أي اكتشافات أو أنماط جديدة لأننا تطرقنا إلى موضوع مفهوم مسبقا وتصنيفاته معروفة، ولكن فائدة التجميع تظهر في تحليل البيانات غير محددة التصنيف.
فعلى سبيل المثال لو توفرت لديك معلومات عن أعمار المتسوقين وأنواع المشروبات التي يشترونها، يمكنك تجميعها في مجموعات تحدد من خلالها إذا ما كان العمر يؤثر على اختيار المشروب، ونوعية المشروب المفضل لفئات عمرية محددة، وبالتالي يتم توجيه المواد الإعلانية للأشخاص طبقا لاختياراتهم المسبقة.
دعونا الآن نتطرق إلى التصنيف، وسنستخدم نفس مثال المركبات، في هذه الحالة قبل أن تبدأ في تحليل البيانات ستسأل صديقك خبير المركبات عن الأصناف المختلفة للمركبات، وفي الغالب سيعطيك جدول بالأصناف المختلفة كما يلي:
وستقوم بناء على هذه الجدول تصنيف المركبات إلى الأصناف الأربعة كما يوضح الرسم التالي:
أو بمعني آخر
العيب الرئيسي للتصنيف أنه قد يمنعك من اكتشاف علاقات جديدة بين البيانات
أرجو أن أكون قد تمكنت من توضيح الفرق بين التجميع والتصنيف،
والله ولي التوفيق دائما
-
-
Recently Browsing 0 members
No registered users viewing this page.
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.