Мобильный Оценщик
Интерпретация графика распределения цен
Как гистограмма цен помогает оценить качество поиска
Во многих приложениях Мобильного Оценщика вы увидите этот график распределения цен. Что на нём изображено и зачем он нужен?

График нужен, чтобы визуально оценить цены найденных в результате поиска аналогов. Диапазон цен (показан на горизонтальной оси, в тыс. руб/кв.м) разбивается на равные интервалы, и подсчитывается количество аналогов, попадающее (=имеющее цену) в каждый интервал. Это количество рисуется на графике в виде столбцов. На каждом столбце есть метка с количеством аналогов в соответствующем интервале.

Кроме того, вычисляется "доверительный" (межквартильный) интервал - в него попадают 50% "центральных" цен аналогов. Этот интервал обозначается на графике зелёным фоном. Дешевле (левее) доверительного интервала - синяя зона, в ней 25% аналогов с самой дешёвой ценой, дороже (правее) расположена красная зона с 25% самых дорогих аналогов. Относительная (измеренная в %) ширина доверительного интервала называется в наших приложениях разбросом выборки, и характеризует, насколько "плотно" легли цены аналогов.

И наконец, красной вертикальной чертой обозначается медиана выборки, которая используется в качестве "средней" (оценочной) стоимости. Медиана значительно более устойчива к выбросам, нежели среднее значение, особенно на малых выборках.
В некоторых случаях на графике для сравнения также рисуется голубая или синяя вертикальная черта, обозначающая цену объекта или просматриваемого аналога (в зависимости от приложения).

Как по графику определить качество поиска? Благодаря визуализации, по гистограмме цен можно быстро на глаз оценить качество выборки.

  • График "хорошей" выборки имеет форму нормального распределения(колокольчика) с ярко выраженным пиком (как график выше).
  • Доверительный интервал "хорошей" выборки относительно узок (ширина интервала не более 15-20% от средней цены), а также покрывает пиковые столбцы цен.
Вот несколько примеров, иллюстрирующих ситуации, когда не стоит доверять средней стоимости, полученной из неоднородной выборки:

  • Если, как на графике ниже, есть несколько пиков, это означает, что в выборку включены аналоги из разных рынков (напр. разные типы домов, или дома разного класса), и медиана показывает "среднюю температуру по больнице". В данном случае нужно определить, какой из пиков соответствует рынку объекта оценки, и удалить нерелевантные аналоги из выборки, чтобы остался только один пик.
  • Если, как на графике ниже, пик находится за пределами доверительного интервала или форма гистограммы несимметрична, значит среднее и доверительный интервал плохо характеризуют выборку (т.е. интервал совсем не "доверительный"). Скорее всего, как и в предыдущем случае, имеет место смешение нескольких рынков, и нужно сделать выбор в пользу более дешёвого или дорогого сегмента, убрав неподходящие аналоги из выборки.