أنا باستخدام فلتر المتوسط المتحرك لتسهيل البيانات لإزالة أوتلير. عن طريق تغيير عدد من النقاط المتوسطة، وأنا الحصول على نتيجة مختلفة. البيانات الخاصة بي هي متجهات ميزة متعددة الأبعاد. لقد طبقت المتوسط المتحرك على المصفوفة بأكملها ثم على المتغيرات الفردية. أنها تعطي نتائج مختلفة. لذلك، كيفية اختيار اختيار عدد من النقاط إلى المتوسط أكثر ويجب تطبيقها على مصفوفة بأكملها أو على أساس واحد تلو الآخر طلب 1 نوفمبر في 21:44 جلينب 9830 157k 9679 20 9679 260 9679 538 نهج واحد لاختيار تكون معلمة التمهيد هي تحسين أخطاء التنبؤ خطوة واحدة إلى الأمام (مثل مبالغ مربعات أخطاء التنبؤ من خطوة واحدة إلى الأمام). إذا كنت تحاول تحديد القيم المتطرفة، فإنك تريد أن يكون هناك مقياس مختلف لخطأ التنبؤ - واحد قوي إلى حد كبير على القيم المتطرفة (ومن ثم فإن المتوسطات المتحركة ستبدو خيارا غريبا - لماذا لا يكون هناك شيء أكثر قوة للقيم المتطرفة) نداش جلينب 9830 نوف 2 13 في 1: (11) لا. على حد سواء. الكل. آسف. ولكن أعتقد أن هذا هو محاولة أخرى (وإن كانت ذكية) لأتمتة ما لا يمكن حقا الآلي. بالطبع أساليب مختلفة تعطي نتائج مختلفة في الأوقات الوحيدة التي لن يكون حيث أوتلير هو واضح بحيث أنك لا تحتاج إلى اختبار. اقتراحي هو استخدام مجموعة متنوعة من الطرق لتحديد القيم المتطرفة المحتملة، ثم فحص تلك القيم المتطرفة على أساس فردي. لدينا خفي يقرأ في البيانات من بعض أجهزة الاستشعار، وبين الأشياء التي يحسب (إلى جانب مجرد مجرد الإبلاغ عن الدولة) هو وهو متوسط الوقت الذي يستغرقه تغيير أجهزة الاستشعار من قيمة إلى أخرى. أنه يحتفظ بمعدل تشغيل 64 داتابوانتس، ويفترض أن وقت التشغيل ثابت إلى حد ما. لسوء الحظ، كما هو مبين في الرسم البياني أدناه، البيانات المدخلات ليست الأكثر البكر: (كل سطر يمثل مجموعة مختلفة من البيانات المحور س لا يعني أي شيء إلى جانب غامض محور التاريخ التاريخي). حل بلدي واضح للتعامل مع هذا سيكون لإنشاء الرسم البياني للبيانات ومن ثم اختيار الوضع. ومع ذلك، كنت أتساءل عما إذا كانت هناك أساليب أخرى من شأنها أن تسفر عن أداء أفضل أو أن تكون أكثر ملاءمة للعمل مع متوسط التشغيل. بعض عمليات البحث السريعة في ويكيبيديا تشير إلى أن خوارزميات الكشف عن القيم المتطرفة قد تكون مناسبة أيضا. البساطة هو زائد، منذ يتم كتابة الخفي في C. تحرير. لقد اخترت ويكيبيديا وخرجت بهذه التقنيات المختلفة: معيار تشوفينيتس: باستخدام المتوسط والانحراف المعياري، احسب احتمال حدوث داتابوانت معين، ثم استبعده إذا كان الاحتمال هو في الواقع أن هذا السوء هو أقل من 50. في حين يبدو هذا أن تكون مناسبة تماما لتصحيح متوسط تشغيل على الطاير، أنا غير مقتنع تماما من فعاليته: يبدو مع مجموعات البيانات الكبيرة أنها لن تريد تجاهل داتابوانتس. اختبار غروبس: طريقة أخرى تستخدم الفرق بين المتوسط والانحراف المعياري، ولها بعض التعبير عن عندما لا يتم رفض فرضية أي القيم المتطرفة كوكس ديستانس: يقيس تأثير داتابوانت على انحدار المربعات الصغرى طلبنا ربما رفضه إذا كان تجاوزت 1 متوسط اقتطاع: تجاهل نهاية منخفضة ونهاية عالية، ومن ثم أخذ المتوسط كما عادي أي شخص لديه أي خبرة محددة ويمكن التعليق على هذه التقنيات الإحصائية أيضا، بعض التعليقات حول الوضع المادي: وقياس متوسط الوقت حتى الانتهاء من غسالة ميكانيكية، لذلك يجب أن يكون وقت التشغيل ثابتة إلى حد ما. أنا لست متأكدا إذا كان لديه في الواقع توزيع طبيعي. تعديل 2. سؤال آخر مثير للاهتمام: عندما الخفي هو بوتسترابينغ، كما هو الحال في، لم يكن لديك أي بيانات سابقة لتحليل، وكيف ينبغي التعامل مع البيانات الواردة ببساطة لا تفعل أي تشذيب أوتلير تحرير 3. شيء اخر. إذا كان الجهاز لا تتغير بحيث أن أوقات التشغيل لا تصبح مختلفة، هل يستحق كل هذا العناء لجعل خوارزمية قوية بما فيه الكفاية بحيث لن تتجاهل هذه أوقات التشغيل الجديدة، وأود أن أتذكر فقط لمسح ذاكرة التخزين المؤقت عندما يحدث ذلك أبريل 12 09 09 في 7 : 24 لقد قرأت في العديد من الأماكن أن المتوسط المتحرك أفضل قليلا من المتوسط المتحرك لبعض التطبيقات، لأنه أقل حساسية للمتغيرات المتطرفة. أردت اختبار هذا التأكيد على البيانات الحقيقية، ولكنني غير قادر على رؤية هذا التأثير (أخضر: متوسط، أحمر: متوسط). انظر هنا: لقد حاولت مع قيم مختلفة لعرض النافذة (هنا في التعليمات البرمجية 1000)، وكان دائما هو نفسه: الوسيط المتحرك ليس أفضل من المتوسط المتحرك (أي لا يقل حساسية عن القيم المتطرفة). نفس مع عرض الإطار 10000 (10000 ارتفاع العرض). يمكنك تقديم مثال يوضح أن المتوسط المتحرك أقل حساسية للمتغيرات المتطرفة من المتوسط المتحرك وإذا أمكن باستخدام نموذج. WAV مجموعة بيانات ملف (رابط التنزيل). أي أنه من الممكن القيام بمتوسط متحرك على هذه البيانات بحيث تكون النتيجة مثل هذا المنحنى الأصفر (بمعنى أنه لا يوجد ارتفاع أعلى) هذا ليس حقا إجابة، ولكنني اعتقدت أن تقرير إد يشير إلى ما هو إم ويطلب المزيد من المعلومات. إيف تحميل ملف test. wav وأستطيع أن أرى إشارة تآمر أدناه. لذلك ما كنت تحصل في المؤامرات التي تظهر ليست كثيرا قيمة المتوسط، ولكن هو أشبه مغلف للإشارة. المسألة الثانية هي أن الإشارة تبدو في الواقع جزءا من الإشارة. إذا كنت التكبير في اللمحة ثم وهذا هو ما أرى: ما الذي تحاول حقا لتحقيق شكرا لردود الفعل. وفيما يلي بعض التعليمات البرمجية R التي تقوم بما يلي: تحميل ملف واف. يأخذ القيمة المطلقة للإشارة (محملة في القناة اليسرى من قبل مكتبة وافير). ينفذ مرشح متوسط متحرك 100 طول على البيانات للحصول على شيء أقرب إلى المغلف (إشارة حمراء). ثم يطبق مرشح وسيط من أطوال 201، 2001، و 4001 إلى النتيجة (إشارة زرقاء). من المؤامرة أدناه، وأفضل أداء هو 4001 طول واحد. وإلا فإن تأثير خلل لا تزال موجودة. الشيء الوحيد الذي يمكن أن أرى خطأ الآن هو أن المغلف لا يطابق المغلف الحقيقي وكذلك إد مثل. وقد يؤدي تحسين كاشف المغلفات إلى تحسين هذا (مثل الإشارة التحليلية أو مثل هذه الإشارات). وفيما يلي قطعة مؤلفة من المغلف المتوسط المرشح المحسوب المضاف على الإشارة الأصلية. شكرا على الوقت الذي أنفقته على هذا السؤال في الواقع، أنا رسمت متوسط ومتوسط القيمة المطلقة للإشارة. ونعم هذا يعطي فكرة عن المغلف، وهذا هو ما أريد. ما كنت أتوقع (بفضل الوسيط بدلا من المتوسط) كان شيئا من هذا القبيل. لقطة شاشة. لسوء الحظ أيا كان عرض النافذة للمتوسط. ارتفاع هو دائما هنا. في حين أن العديد من الوثائق يقول ان الوسيط لديه ميزة خفض تأثير القيم المتطرفة القيم. نداش بسج 30 نوفمبر في 14:01 الحق، وبالتالي فإن السؤال I39m يسأل: كوتلير من واتكوت. -) أخذ وسيط مباشر أو متوسط من البيانات لديك سوف تسفر عن نتائج غير حساسة. ولا يعمل الترشيح الوسيط إلا عندما تكون بضعة عينات (فيما يتعلق بطول النافذة) خارج النطاق المتوقع. لأن البيانات لديك يتأرجح إيجابية وسلبية، الوسيط isn39t مناسبة حقا لذلك. وينبغي أن يعمل متوسط متوسط المغلف على نحو أفضل. قد تحتاج حتى لوضع مرشح بسيط تمرير منخفض على القيمة المطلقة للحصول على قيمة المغلف أكثر ثباتا. ندش بيتر K. 9830 نوف 30 15 في 14:05
Comments
Post a Comment