Три вида лжи. Ложь, наглая ложь и… статистика

Каков процент подтасовки статистических данных в научных работах по психологии, какие ошибки выявила программа проверки и чем она похожа на Т9, выяснил сайт.

Программы могут не только постмодернистские тексты песен, путь в Лондонском метро, моделировать процессы и в банке, но и искать ошибки в работах нечестных или невнимательных психологов. сайт рассказывает, как компьютер выявляет неточности в научных работах и к чему это может привести.

Блеск и нищета современной психологии

Балансируя между «житейскими мудростями» и философско-метафизическими категориями на тоненькой ниточке непротиворечивых данных, «наука о душе» постоянно подвергается опасности перегибов. Копаться во внутреннем мире людей (если не рассматривать анатомическую сторону вопроса) никогда не было просто, поэтому исследования психологов с трудом поддаются верификации. Имея очень субъективный предмет изучения, психология некоторыми своими отраслями и разделами пересекается с медициной и нейробиологией, а другими выходит за грань научного: даже доктор психологических наук и заместитель директора Института психологии РАН Андрей Юревич определил место психологии между наукой и паранаукой. Даже примененные по всем правилам научной методологии, подходы психологии порой не дают удовлетворительных результатов. Если в более тщательной и долгой работе с одним человеком можно предположить уникальность случая и заявить, что экстраполировать выводы на всех людей нельзя, то в большой группе трудно понять, какое в действительности значение имеют для каждого участника исследования унифицированные вопросы и ответы. К тому же, у испытуемых всегда могут быть внутренние причины скрывать какую-либо информацию и отвечать на вопросы не до конца честно. Поэтому рефлексию (обращение внимания человека внутрь себя) нельзя считать инструментом, позволяющим добыть абсолютно достоверную информацию. о компьютерном алгоритме, который выявил потенциальные ошибки в почти восьми тысячах психологических статей (и это только в период с 1985 по 2013 год и только в восьми научных психологических журналах) сработала как палка, разворошившая осиное гнездо, и без того неспокойное из-за постоянных споров. Под руководством Мишель Нюйтен было проанализировано 30 717 статей, из них 16 695 использовали статистические данные. В половине из этих работ была как минимум одна предполагаемая статистическая ошибка, на которую указала программа.

Когда исследование проводится на большой группе испытуемых, для обработки используются статистические методы. Популярное высказывание «существует три вида лжи: ложь, наглая ложь и статистика», авторство которого так туманно, что более ста лет назад Марк Твен приписал его Бенджамину Дизраэли (но уже не был уверен, откуда оно на самом деле пошло), не так уж далеко от истины. В области человеческого знания, где так сложно создавать теории, обладающие достоверной предсказательной силой (вспомните того же Зигмунда Фрейда или Альфреда Адлера), риск случайной ошибки и соблазн сознательной «подгонки» действительного результата под желаемый довольно высок.

Как компьютер «поймал с поличным» нечестных психологов

Программа, которая подтвердила справедливость этого ироничного наблюдения, называется Statcheck. Она анализирует P-значение (p-value) - величину, которую ученые используют для проверки статистических гипотез. Эта цифра показывает, насколько вероятен полученный результат, если нулевая гипотеза, лежащая в основе исследования, верна. В статье, которая была опубликована в журнале Behavior Research Methods, показано, что программа оценила достоверность более чем 258 000 p-значений (примерно 11 на каждую научную работу) за два часа, обнаружив, что 13% работ содержат ошибку, которая «переворачивает» полученные данные. В результате, например, P < 0,05 превращается в P = 0,05, или некоторые знаки после запятой просто отбрасываются, а не влияют на следующий знак по правилам округления чисел. Казалось бы, такое маленькое различие не должно серьезно влиять на результат, однако чаще всего P = 0,05 принимается как пограничное значение между статистически достоверным и недостоверным результатом. В итоге малейшее отклонение в одну или в другую сторону делает вывод в статье ложноположительным или ложноотрицательным.

Первоначально программа работала с литературой в целом, но один из соавторов исследования, Крис Хартгеринк, специалист по научной методологии из Тильбургского университета (Нидерланды), предложил сконцентрировать внимание на более специфических текстах - научных статьях. Он же позднее, в августе этого года, загрузил на проверку 50 000 статей и выложил результаты в Pub Peer (форум ученых, где они часто обсуждают вышедшие научные статьи), вызвав огромный резонанс в профессиональном сообществе. По мнению Хатгеринка, такие посты будут информировать авторов о возможных ошибках и «принесут науке гораздо больше пользы, чем просто свалка данных». С ним, как сообщает дискуссионная статья Монии Бейкер в Nature, согласны не все. Часть ученых, в том числе представители Немецкой психологической ассоциации, предупреждает, что ложноотрицательные результаты (здесь подразумевается исправление компьютером правильных данных на неправильные) могут скорее навредить репутации ученых, чем помочь развитию психологии как науки. Исполнительный директор Ассоциации психологических наук в Вашингтоне в ответ на публикацию заявил, что осуждает «повальное очернение» психологов в блогах и социальных медиа, явственно дав понять, что публикации результатов компьютерного анализа с указанием на возможные ошибки должны расцениваться как оскорбление.

Statcheck и P-value: кого в топку, кого в топ?

С другой стороны, подобные посты продвигают концепцию открытой науки (кстати, и Нюйтен, и Хартгеринк имеют награды от организаций, поощряющих развитие этого направления), которая позволит быстрее находить и корректировать статистические неточности. По мнению Ника Брауна, ученого-психолога из Университета Гронингема в Нидерландах, такие алгоритмы помогут только в том случае, если исследователи начнут читать их и оценивать с точки зрения специалистов, а не просто проникаться недоверием к журналу, опубликовавшему сомнительные статьи с ошибками.

На данный момент уже несколько тысяч человек, воодушевленных этой возможностью, бесплатно скачали эту программу, написанную на языке программирования R.

Однако Statcheck и сам может делать ошибки, как заявляет Томас Шмидт, критикуя программу . Например, она не всегда учитывает необходимые статистические погрешности и порой не может понять, что неверно в статье: P-значение или относительный параметр. Просканировав две статьи с большим количеством статистических данных, он обнаружил, что программа не смогла оценить 43 параметра, проверила 137 и определила 35 как «потенциально некорректные». Два из них оказались ошибками, не влияющими на результат, три были ошибками в других параметрах, не касающихся P-value, а остальные 30 оказались результатом «ложной тревоги».

Некоторые психологические журналы и вовсе начинают отказываться от p-value для проверки достоверности гипотез, считая этот параметр недостаточно надежным.

Сами создатели не отрицают, что их программа «никогда не будет столь же точна, как проверка вручную», но подчеркивают быстроту ее работы: если на проверку достоверности значения P-value одной средней психологической статьи уходит около десяти минут, то программа может справится с десятками тысяч в считанные часы, что незаменимо для проведения мета-анализа или первичной проверки присылаемых редакторам научных журналов статей. В этом качестве ее уже с июля этого года используют редакторы журнала Psychological Science. Они сравнивают эту программу с корректорами Word или T9, над нелепостью которых все смеются, но отказаться от них согласились бы немногие. Как и эти автокорректоры, Statcheck, по их мнению, можно считать «удобным инструментом, который иногда говорит глупости».

«Ложь, наглая ложь и статистика » (полный вариант: Существуют три вида лжи: ложь, наглая ложь и статистика , англ. There are three kinds of lies: lies, damned lies, and statistics ) - высказывание, приписываемое премьер-министру Великобритании Бенджамину Дизраэли , а известность оно получило благодаря Марку Твену после публикации «Главы моей автобиографии» в журнале North American Review 5 июля 1907 г. : «Цифры обманчивы, - писал он, - я убедился в этом на собственном опыте; по этому поводу справедливо высказался Дизраэли: „Существует три вида лжи: ложь, наглая ложь и статистика“». Однако этой фразы нет в работах Дизраэли. Также она не была известна ни при его жизни, ни вскоре после смерти. С точки зрения современных представлений наиболее вероятной кандидатурой на авторство является Чарльз Дилк (1843-1911).

Это высказывание, помимо Дизраэли, приписывали также и многим другим: журналисту и политику Генри Лабушеру (1831-1912) и Леонарду Кортни (1832-1918), который использовал эту фразу в 1895 году. Два года спустя он стал президентом Королевского статистического общества .

Сейчас известно, что впервые фраза использована в письме, написанном 8 июня 1891 года и опубликованном 13 июня 1891 года в National Observer(p.93(-94): NATIONAL PENSIONS London, 8th June, 1891): «Сэр, … очень остроумно замечено, что существует три вида лжи: первая - неправда, вторая - прямая ложь, и, наконец, самое страшное - это статистика». Чуть позже, в октябре 1891, в журнале Notes and Queries человек под псевдонимом «St Swithin» прислал вопрос об авторстве этой фразы, что указывает на ее широкое распространение уже в те дни. В октябре 1891, Charles W. Dilke, без какой-либо ссылки на автора, дважды использовал это высказывание. «Сэр Charles Dilke (1843-1911) на днях сказал, что, по его мнению, „ложь“ можно классифицировать по возрастающей степени, как: невинная ложь, ложь и статистика» (The Bristol Mercury and Daily Post, Monday, October 19 1891 г.). Dr. E.R.L. Gould, который использовал эту фразу в 1892 г., также ссылался на авторство Charles Dilke: "Сэр Charles Dilke в определенном смысле был прав, сказав: «Есть три уровня лжи, - выдумка, ложь и статистика …» .

Как упоминает Роберт Гиффен (Robert Giffen - помощник редактора журнала The Economist и в 1882-84 - президент Статистического Общества) в 1892 г., высказывание «о статистике» лишь интерпретация фразы «Есть старая шутка о том, что существует три вида лжецов: обычные обманщики, возмутительные лжецы и научные эксперты. Позже стали говорить несколько иначе: есть три степени лжи: ложь, бессовестная ложь и статистика». .

Возникновение оригинала («про экспертов») приписывают более раннему периоду, чем высказывание «про статистику», а именно в журнале Nature от 26 ноября 1885 г. (заметим, что Дизраэли к этому моменту уже умер) на 74 стр. находим: «…одному известному адвокату, в настоящее время - судье, пришло в голову разделить свидетелей на три группы: простые лжецы, проклятые лгуны, и эксперты».

Примечания


Wikimedia Foundation . 2010 .

Смотреть что такое "Ложь, наглая ложь и статистика" в других словарях:

    Самая точная из всех лженаук. Джин Ко Статистика может доказать что угодно, даже правду. Ноэл Мойнихан Статистика есть наука о том, как, не умея мыслить и понимать, заставить делать это цифры. Василий Ключевский Статистика все равно что купальник …

    Ложь бывает четырех видов: ложь, наглая ложь, статистика и цитирование. Не следует беззастенчиво лгать; но иногда необходима уклончивость. Маргарет Тэтчер Верь только половине того, что видишь, и ничему из того, что слышишь. Английская пословица… … Сводная энциклопедия афоризмов

    Гистограмма (метод графических изображений) У этого термина существуют и другие значения, с … Википедия

    Статистика - (Statistics) Статистика это общетеоретическая наука, изучающая количественные изменения в явлениях и процессах. Государственная статистика, службы статистики, Росстат (Госкомстат), статистические данные, статистика запросов, статистика продаж,… … Энциклопедия инвестора

    - (1835 1910 гг.) американский писатель Ад единственная действительно значительная христианская община во Вселенной. Банкир это человек, который одолжит вам зонтик в солнечную погоду и отберет его в тот самый момент, когда начинается дождь. Билл… … Сводная энциклопедия афоризмов

    Цитата: неверное повторение чужих слов. Амброз Бирс Цитата это риск под чужую ответственность. Владислав Гжещик Если тебя цитируют ты уже кто то. Если у тебя крадут ты человек выдающийся. Но настоящая слава начинается лишь тогда, когда тебе… … Сводная энциклопедия афоризмов

    Гарри Каспаров Гарри Кимович Каспаров Гарри Каспаров, 2007 год Дата рождения: 13 апреля 1963 (46 лет) Место рождения … Википедия

.
Полный вариант этого афоризма: «Существуют три вида лжи: ложь, наглая ложь и статистика» (англ. There are three kinds of lies: lies, damned lies, and statistics). Его авторство приписывается разным людям, а известность оно получило благодаря М.Твену после публикации «Главы моей автобиографии» в журнале North American Review 5 июля 1907 г.: «Цифры обманчивы, — писал он, — я убедился в этом на собственном опыте; по этому поводу справедливо высказался Дизраэли: „Существует три вида лжи: ложь, наглая ложь и статистика“». Некоторые полагают, что оригинальная фраза звучала как «Есть старая шутка о том, что существует три вида лжецов: обычные обманщики, возмутительные лжецы и научные эксперты», и лишь позже стали говорить несколько иначе: «Есть три степени лжи: ложь, бессовестная (наглая) ложь и статистика».
Вряд ли столь важно, кто является автором этого афоризма, важно то, что он хорошо иллюстрирует ситуацию с тем, что говорят врачи-«эксперты» большинству людей, имеющих серьёзные (и не очень) заболевания.

****
В 1992 году известному американскому палеонтологу и биологу Стивену Гулду врачи поставили диагноз «рак» (мезотелиома брюшины) и сообщили, что с таким диагнозом в среднем живут 8 месяцев. Гулд привел в порядок свои дела, но не опустил руки, а стал лечиться - операция, химия и облучение. И умер. Через двадцать лет.
.
Через два года после оглашения диагноза в журнале Discover он опубликовал свою статью «Не верьте медиане» ("The Median Isn"t the Message"), в которой наглядно описал то, как соотносятся статистика и конкретные случаи из жизни. Оригинальный текст - по ссылке , ниже - почти полный перевод и далее мои комментарии.

.
Предисловие к статье - С.Данн (Steve Dunn, создатель сайта http://cancerguide.org , которому врачи поставили диагноз «рак почки 4 стадии», после чего удалили почку. После такого «лечения» он 17 лет вёл очень активный образ жизни, женился, завёл детей, занимался альпинизмом и горными лыжами. Умер в августе 2005 г. от совсем другой болезни (инфекционного менингита).

.
Стивен Джей Гулд был влиятельным биологом-эволюционистом, преподавателем в Гарвардском университете, автором не менее десятка популярных книг по различным областям науки.
Насколько я могу судить, эта статья является самой мудрой, самой гуманной из когда-либо написанных о раке и статистике. Это противоядие и для тех, кто говорит, что «статистика не имеет значения», и для тех, кто имеет привычку оглашать «смертные приговоры» пациентам, которые сталкиваются с тяжёлыми прогнозами. Тот, кто ищет ответы в официальной медицинской литературе, будет находить там «страшную статистику» для практически любых болезней. Тот, что прочитает эту статью, возьмёт на вооружение надежду.

Не верьте медиане "The Median Isn" t the Message"
.
В последнее время мою жизнь постоянно иллюстрируют две известные шутки Марка Твена. Одну я пока приберегу для конца этой статьи, а вторая (иногда приписываемая Дизраэли), говорит о трёх разновидностях лжи, причём каждая последующая хуже предыдущей - ложь, наглая ложь и статистика.
.
Рассмотрим стандартный пример «размазывания» правды в пространстве или во времени - что оказалось весьма актуальным для моей личной истории. Статистика признает различные способы определения «среднего значения» или «средней тенденции». Наша привычная концепция определения среднего значения достаточно проста - сложить значения всех элементов и полученную сумму разделить на количество элементов (100 конфет, собранные пятью детьми на Хэллоуин, даёт по 20 конфет каждому ребёнку в этом идеальном мире). - другая мера средней тенденции, является значением функции в середине графика. Например, если я расставлю пять детей по росту, то средний ребёнок будет ниже двух предыдущих и выше двух последующих (однако, у этих двух малорослых детей могут быть проблемы при делёжке конфет в группе с более высокими детьми…).
.
Можно ещё проиллюстрировать это так: политический лидер может с гордостью сделать заявление: «средний доход наших граждан составляет $15000 в год», на что лидер оппозиции может возразить: «Но половина наших граждан имеет реальных доход менее $10000 в год». И они оба будут правы, хотя никто из них не использует статистику с бесстрастной объективностью. Первый говорит о среднем арифметическом , второй - о медиане (среднее арифметическое больше, чем медиана в подобных случаях, потому что один миллионер может перевесить сотни бедных людей при вычислении среднего значения, но он может сбалансировать только одного нищего при расчёте медианы).
.
Чем важнее (глубже, опаснее, тяжелее и т.п.) вопрос, тем большее недоверие и презрение создаётся к статистике при его рассмотрении. Многие люди допускают трагичный и недопустимый разрыв между сердцем и умом, своими чувствами (ощущениями) и интеллектом. В некоторых современных традициях наоборот слишком много значения уделяется чувствам как основе для действий, в то время как интеллект отодвигается на задний план как «устаревший инструмент». Статистике в этой абсурдной дихотомии часто навешивается ярлык «врага».
.
Эта статья - описание личной истории дружбы с правильно интерпретированной статистикой, воодушевляющей и дающей надежду. Это небольшая история о полезности непредвзятого научного знания и о том, что голова и сердце - координаторы действий одного тела, единой личности.
.
В июле 1982 года я узнал, что у меня , редкая и серьёзная форма рака. Когда я отошёл от наркоза после операции, мой первый вопрос врачу и химиотерапевту был такой: «Что является лучшей литературой о мезотелиоме?», на что я получил ответ с явным дипломатическим оттенком, что в медицинской литературе не содержится ничего, что действительно стоит читать.
.
Ну разумеется, совет учёному держаться подальше от книг является таким же действенным, как совет хомо сапиенсу быть целомудренным и воздерживаться от секса. Как только я мог ходить, то направился прямиком в Гарвардскую медицинскую библиотеку и ввёл в компьютер запрос обо всём, . Через час, в окружении всей доступной литературы по брюшной мезотелиоме, я понял, почему мой врач дал мне такой гуманный совет. Во всей найденной мне литературе не могло быть более недвусмысленной информации: мезотелиомы неизлечимыми, медиана смертности - всего восемь месяцев после определения диагноза. примерно пятнадцати минут, затем улыбнулся и сказал себе: так вот почему они не дают мне ничего читать! Слава богу, тогда мой ум снова начал работать.
.
Я столкнулся с классическим примером того, когда ». И это имеет прямое отношение и к борьбе с раком. Возможно потому, что наше ментальное состояние «подкармливает» и иммунную систему, но люди, имеющие один и тот же вид рака, отличающиеся по возрасту, социальному классу, условий получения медицинской помощи, в общем - имеющие позитивное отношение к жизни, сильную волю и жизненные цели - и живут дольше, они обязательно будут бороться или хотя бы искать пути выхода из болезни, а не просто пассивно принимать что-либо, сказанное врачами. Несколько месяцев спустя я спросил сэра Медавара, моего личного научного гуру и лауреата Нобелевской премии в области иммунологии, каков может быть лучший рецепт для успеха против рака? «Личность сангвиника» - кратко ответил он. К счастью (поскольку нельзя поменять себя в короткие сроки и с какой-то одной определённой целью), я и так всегда был уравновешенным и уверенным в себе человеком именно с таким складом характера.
.
Отсюда возникает дилемма для врачей: ведь если личное отношение человека к тому, что с ним происходит, имеет такое важное значение, для чего делать столь мрачные заключения (предсказания?..), особенно когда лишь немногие люди имеют достаточно понимания принципов статистики, чтобы оценить то, что на самом деле означает то или иное утверждение? Лично у меня было такое понимание, и я убеждён, что именно это сыграло важную роль в сохранении моей жизни. Знание действительно сила !
.
Кратко первый (а может быть и самый главный) вопрос может звучать так: что именно значит фраза «медиана смертности - восемь месяцев»? Я подозреваю, что большинство людей, без особых знаний в области статистики, переведут эту фразу как «я, вероятно, буду мёртв через восемь месяцев» - именно этого скоропалительного вывода следует избегать, т.к. само отношение к ситуации и к прогнозам имеет огромное значение.
Конечно, я не был вне себя от радости, но я и не интерпретировал эти данные подобным образом. Моя техническая подготовка позволила мне иметь другой взгляд на «восемь месяцев медиальной смертности».
.
Мы по-прежнему несём исторический груз платоновского наследия, стремясь к объяснению всего, к чётким определениям и разграничениям, пытаясь, таким образом, например, найти однозначное «начало жизни» или точное определение смерти, хотя природа часто представляется нам как континуум с плавным переходом одного в другое. Это платоновское наследие, с его акцентом на чёткие различия и разделение неразделимого приводит нас к ложным оценкам статистических данных. Короче говоря, мы воспринимаем среднее значение и медиану как жёсткую «реальность», и напротив - мы не учитываем целый набор различных переменных и несовершенство измерений. Если просто взять медиану как данность и учитывать, что имеется вокруг неё для более глубокого анализа и расчёта, то интерпретация «я, вероятно, буду мёртв через восемь месяцев» может потерять свою актуальность. (кстати, обратная ситуация также возможна - Е.М.)
.
Но все эволюционные биологи, коим я тоже являюсь, знают, что именно вариабельность тех или иных параметров есть неизменная сущность всего живого. Именно изменения, варианты одного и того же есть суровая реальность. Среднее статистическое и медиана являются лишь абстракциями. Поэтому я посмотрел на статистику мезотелиомы совсем по-другому - и не только потому, что я оптимист, который стремится увидеть сам бублик вместо дырки, но в первую очередь потому, что я знаю, что только вариация есть реальность. И я должен был разместить себя среди этих разных вариаций.
.
Когда я узнал о восьмимесячной медиане, моя первая интеллектуальная реакция была: «прекрасно, половина людей живёт дольше этих восьми месяцев. Как насчёт моих шансов попасть в эту половину?» После часа нервных и бешеных расчётов я с облегчением пришёл к выводу: мои шансы чертовски велики. Я обладал каждой из характеристик, дающих вероятность большей продолжительности жизни: я был молод; моя болезнь была диагностирована в относительно ранней стадии; я могу получить лучшее медицинское лечение; я хочу жить; я знаю, как должным образом интерпретировать данные и я не отчаиваюсь.
.
Другой технический вопрос также добавил мне ещё больше утешения. Я сразу понял, что реальное распределение вариации при «восьмимесячной медиане» почти наверняка будет тем, что статистики называют «правый перекос» (при симметричном распределении профиль графика слева от медианы является зеркальным отражением профиля справа; при асимметрии распределение на одной половине более «вытянуто»).
.

.
Я рассуждал, что в случае моей мезотелиомы график должен был иметь именно правый перекос (позитивная асимметрия), ведь, в конце концов, часть графика слева от медианы описывает только те случаи, когда мезотелиома диагностируется либо посмертно, либо за небольшое время до смерти человека. Таким образом, существует не так много возможностей для попадания в этот диапазон, ведь он всего располагается между нулём и восемью месяцами. Но верхняя (или правая) половина может простираться на многие годы, даже если никто из диагностированных людей в конечном счёте не выживает. Распределение должно иметь именно этот, правый перекос, и мне нужно знать, как далеко расположен «хвост» графика - потому что я уже пришел к выводу, что мой благоприятный «профиль пациента» сделал меня хорошим кандидатом для этой половины графика.
.
Распределение действительно сильно искажено право, имеет длинный «хвост», пусть и не столь большой по амплитуде, но продлённый на несколько лет дальше медианы в восемь месяцев. Я больше не видел никаких причин, почему я не должен быть в этом «хвосте», и я сделал очень долгий вздох облегчения. Мои технические знания помогли мне и на этот раз. Я правильно прочитал график. Я задал правильный вопрос и нашёл ответы. Я получил, по всей вероятности, самый ценный из всех возможных подарков в имеющихся условиях - значительное время. Меня уже ничто не держало и ничто не могло заставить немедленно следовать словам Исаии к Езекии - «Приведи свой дом в порядок, потому что ты умрёшь, и не будешь жить!»
.
Ещё один момент о статистических распределениях: имеющийся "официальный" график применим только к вполне определённому набору обстоятельств и показывает выживаемость при мезотелиоме при обычных режимах лечения. Но если меняются обстоятельства, распределение также может измениться. Мне был прописан экспериментальный протокол лечения, и, если Фортуна улыбнётся, я попаду в первую группу уже нового распределения с высокой медианой и правым «хвостом» графика, длящегося до смерти от естественных причин в глубокой старости.
.
На мой взгляд, слишком модно стало считать принятие смерти равносильным внутреннему достоинству. Конечно, я согласен с проповедями Экклезиаста, что «есть время любить и время умирать», и когда мой источник жизни иссякнет, я надеюсь встретить свой конец спокойно и с достоинством. В большинстве случаев, однако, я предпочитаю быть иного мнения, а именно что за жизнь нужно бороться.
.
Выбор оружия в этой борьбе очень широк, но нет ничего более эффективного, чем юмор. Моя смерть была объявлена на заседании моих коллег в Шотландии, и я испытал большое удовольствие от чтения своего собственного некролога, сочиненного одним из моих лучших друзей (кстати, вряд ли следует считать случайностью то, что он является статистиком и что он поверил в мою неизбежную смерть, т.к. не ожидал найти меня так далеко в правом «хвосте» вышеуказанного графика). Тем не менее, этот инцидент был первым, который дал мне возможность посмеяться после того, как я услышал свой диагноз. Подумать только, я чуть не повторил ещё один известный афоризм М.Твена: «слухи о моей смерти сильно преувеличены».

Послесловие С.Данна
.
К сожалению, С.Гулд умер в мае 2002 года в возрасте 60 лет, но он прожил ещё двадцать очень продуктивных лет после постановки диагноза и, таким образом, превысил «статистическую» восьмимесячную медиану выживаемости в тридцать раз! Хотя он и умрер от рака, это была никак не та мезотелиома, а совсем другой вид.
В марте 2002 года доктор Гулд опубликовал свою 1342-страничную книгу «Opus Magnum» - Структуру Эволюционной Теории. И видится очень логичным, что доктор Гулд, один из самых плодовитых учёных и писателей мира, смог завершить окончательный отчёт о своей научной деятельности и рассказ о своей философии как раз вовремя. Эта книга является слишком длинной для обычного человека - но произведения С.Д.Гоулда будут жить. Особенно, как я надеюсь, статья «The Median Isn" t the Message».

***********
На самом деле комментариев моих к этой статье практически не будет - ни про "экспериментальные протоклы лечения", ни про "пророчества врачей" - про это уже много материалов в моём ЖЖ. Но про то, что статистика часто интерпретируется совершенно «криво» - будут отдельные посты.
.
Хочу лишь отметить, что не случайно в этой статье доктор Гоулд упомянул фразу «профиль пациента» - поскольку он также употребил слова «личность сангвиника», это имеет отношение к психологии, а не просто к финансовому состоянию человека или его социальному статусу. Ничего не бывает случайно в этом мире. Пару дней назад в ЖЖ увидел пост с названием «Роль личности в онкологии», где были даны ссылки на эксперименты (да, та самая статистика) и сделан в итоге вывод, что эта роль "слишком преувеличена". Но как бы ни хотели отдельные граждане отгородиться от своей психики (от своей личности), как бы ни хотели они верить в то, что болезнь - «спускается откуда-то сверху по независящим от меня причинам», комментируя всё это словами вроде «достали уже все эти верящие в психологическую природу рака» - из песни слов не выбросишь - от себя не убежишь.
.
Но про это - следующий пост.
.
Будьте здоровы. Живите с юмором.

Есть весьма «бородатая» призказка. Наверняка вы ее слышали. Итак…

Существует три вида лжи:

  1. Гнусная ложь
  2. Статистика

Обычно в этом месте произносят слово «лопата» и все смеются. Но давайте рассмотрим факты, которые сейчас мелькают в свежих новостях.

Факт №1

«Левада-Центр» провел соцопрос (опрашивались россияне всех возрастов), который показал, что самая популярная социальная сеть в нашей стране — «Одноклассники» . В ней состоит примерно 76% опрошенных .

Круто! Срочно бежим заводить там аккаунт! Для тех кто в танке о том, как зарегистрироваться в одноклассниках очень подробно рассказывается на akak.ru по ссылке. Это сайт, на котором лежат инструкции как что сделать.

Но это, как вы поняли, статистика, которую предоставил «Левада-Центр».

Факт №2

  • Самая популярная сеть по их данным — «ВКонтакте». В нее заходит 38 млн. посетителей в сутки.
  • «Одноклассники» имеют 30 млн. посетителей.
  • «Мой мир» — 16 млн.

Вопрос №1: Кому верить?

Поскольку это статистика, третий вид лжи , то верить нельзя никому. Как можно рассчитывать популярность социальной сети исключительно по косвенным данным?

Опрос. Что он показал? Только предпочтения фокус-группы.

Где ее отбирали? Каким способом опрашивали? В каком регионе? Говорили ли они правду?

Согласно данным соцопроса, 100% россиян пользуются интернетом! Опрос проводился на сайте.

Количество посетителей в сутки. Что показывает оно?

Представьте среднестатистического офисного работника. У него «ВКонтакте» установлен в телефоне, он заходит туда с работы, а потом еще вечером из дома. Это уже 3 посетителя с разным IP, браузером и пр.

При этом, у «Одноклассников» более старшая целевая аудитория. Значит мобильные приложения и заход из офиса для них, считайте, закрыт.

Ворпос №2: Что делать с этой информацией?

Вывод №1 — Нельзя слепо доверять статистике!

Вывод №2 — Очевидно, что самые популярные социалки: «ВКонтакте» и «Одноклассники». Думаю, что ЖЖ (хоть они и «социальная медиа») тоже в тройке лидеров.

Вывод №3 — Если вам есть что рассказать или предложить людям, заводите аккаунты в самых популярных соцсетях. Так точно не ошибетесь.

Послесловие

Как гласит крылатое выражение Доктора Хауса (сериал «Доктор Хаус») — «…Все лгут…». Помните это.

А с вами был Доктор Лексиум
Помните, что необходимость соображать своей головой еще никто не отменял.

Марк ТВЕН

Законы теории вероятностей не являются абстрактными, а математически выражают реальные закономерности массовых случайных явлений природы.

Разработка методов регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений, составляет предмет МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.

1

Определение закона распределения случайной величины по статистическим данным.

Так как на практике приходится иметь дело с ограниченным количеством экспериментальных данных, то результаты наблюдений всегда будут содержать элемент случайности.

Поэтому возникает задача сглаживания статистических данных и описания их с помощью простых аналитических зависимостей.

2

Проверка правдоподобия гипотез.

Эта задача связана с предыдущей. Например, она может отвечать на вопрос: согласуются ли результаты эксперимента с гипотезой о том, что случайная величина подчиняется данному закону распределения?

3

ждение неизвестных параметров распредел

Часто необходимо определить не сам закон распределения СВ на основе экспериментальных данных, а некоторые числовые характеристики ПриСВ.малом числе опытов определяются только «оценочные» значения этих параметров, т.е. такие приближенные значения, которые приводят в среднем к меньшим ошибкам, чем

Отдел маркетинга швейной фабрики прове анкетирование 100 покупателей. В числе вопросов анкеты были вопросы о мужских костюмах. Обработка анкет дала следующие результаты о предпочтении:

По месту изготовления: 40 % - отечественные, 60 % - импортные.

2. По стоимости в долларах США:



Понравилась статья? Поделитесь с друзьями!