Формула среднеквадратической ошибки:
Т. е. имеем на входе вектор контрольных значений и вектор прогнозируемых значений и получаем некую величину характеризующую общую ошибку.
Может, кто знает, почему нельзя использовать более простую формулу, т. е. без квадратов и пр. :
error = (|X1 - Y1| + |X2 - Y2| +..+|Xn - Yn|) / n
Мне тоже это было в свое (очень далекое) время интересно.
Можно использовать. Но скажу, почему не используют. От суммы модулей производную хрен возьмешь. А это ЧАСТЕНЬКО будет нужно) ) Весьма частенько) ) Например, при использовании метода наименьших квадратов) ) Если использовать модули - расчеты станут слишком сложными) ) Попробуй-ка взять производную от суммы модулей, а мы тут посмотрим) )
Причем тут площади, я вообще не понимаю. Случайная величина может зависеть от десятков, сотен и тысяч параметров - рассеяние происходит в многомерном пространстве...
Она наверняка имеет какой-то физический смысл при оценке, скажем, отклонений скоростей молекул от значения, определяемого внутренней энергией данного количества вещества. Во многих других случаях оно скорее всего "мода", хотя я могу ошибиться. Впрочем, существует с дюжины и других средних и, если не ошибаюсь, и ими пользуются.
Сейчас я тебе объясню, Миш.
Вообще куча значений отклонений этих самых значений от среднего имеет в конце концов простой смысл - построить кривую распределения вероятности. Иначе статистика по ошибкам вообще не нужна.
Простой пример для понимания о чем речь. Вот ты провел 20 опытов, получил 20 значений из интервала 10 ...90, примерно так равномерно легли. Посчитал среднее значение, получил 50.
Другая серия опытов, опять 20 результатов, но из интервала 49...51. Среднее опять 50.
В чем разница? Разница в том, что во втором случае можно почти достоверно утверждать что все последующие значения лягут в очень узкий интервал (вряд ли вообще выйдут из 49-51, или с крайне низкой вероятностью) , а в первом случае - куда угодно (и 110 получить вполне реально) . Но это на словах.
Для научной работы надо построить зависимость вероятности получения след. значения от этого самого значения. Эта кривая лучше всего нормируется из величины именно квадрата отклонения (Гаусс еще доказал, почитай про "нормальное распределение Гаусса").
К слову сама функция распределения вероятности имеет как раз вид e^(-квадрат отклонения) (я отбросил нормирующие коэфф. и среднее значение, чтоб суть была понятна) .
Вот поэтому и считают именно сумму квадратов отклонений.
Кстати, вот реальный пример, идет голосование. Если в одном регионе при одной сходной выборке корреспондентов на соседних участках имеем результаты за некую партию 28% и 85% (цифры взял примерно с потолка). , а среднеквадратичное отклонение внутри региона больше чем мужду регионами. т. е. "распределение по Чурову" сильно отличается от "распределения по Гауссу", то можно с высокой вероятностью утверждать, что достоверность результатов крайне низкая :)
Я когда то тоже задавался этим вопросом работая с метрологией и понял что среднеквадратичное значение учитывает площадь рассеяния точек - значений измеряемой величины . А арифметическое среднее значение учитывает только амплитуду рассеяния этих точек, следовательно второй способ менее точный при расчете погрешности ...
Ну 1/n это скорее всего что то навроде формулы вычисления процентов:
x/100%*n%.
Когда ты делишь число на 100%, то ты узнаешь чему будет равна одна единица в твоей системе из 100%.
В то же время ты устанавливаешь некоторый ограничительный максимум в сто.
Ну и здесь нечто подобное.
Только что тебе нужно установить ограничение твоей системы до 1.
При измерении действующих значений например напряжения всегда имеет значение площадь охватываемая графиком функции изменения этого напряжения , точнее интеграл этой функции ...