Систематическая ошибка. Систематические и случайные ошибки. Приемы повышения чистоты осадка

Ошибки измерения делятся на случайные (тот самый шум, о котором шла речь ранее) и систематические. Прояснить, что такое систематическая ошибка, можно на следующем примере: предположим, мы немного изменим в схеме по рис. 13.3 сопротивление резистора R2. При этом у нас на определенную величину сдвинется вся шкала измерений: показания термометра будут соответствовать действительности, только если мы прибавим (или вычтем, неважно) некоторую константу к полученной величине: / = /’ + 5, где / - «правильное» значение температуры (оно все же отличается от истинного значения из-за наличия случайной ошибки); /’ - показания термометра; 5 - величина систематической ошибки из-за сдвига шкалы. Более сложный случай систематической погрешности - если мы оставим R2 в покое, а немного изменим R5, то есть изменим наклон характеристики термометра, или, как еще это называют, крутизну преобразования. Это равносильно тому, что мы умножаем показания на некий постоянный множитель к, и «правильное» значение будет тогда определяться по формуле: t = ht\ Эти виды ошибок носят название аддитивной и мультипликативной погрешностей.

О систематических погрешностях математическая статистика «ничего не знает», она работает только с погрешностями случайными. Единственный способ избавиться от систематических погрешностей (кроме, конечно, подбора прецизионных компонентов) - это процедуры калибровки (градуировки), о них мы уже говорили в этой главе ранее.

Случайные ошибки измерения и их оценка

я предполагаю, что читатель знаком с таким понятием, как вероятность. Если же нет - настоятельно рекомендую книгу , которая есть переиздание труда от 1946 г. Расширить кругозор вам поможет классический учебник , который отличает исключительная внятность изложения (автор его, известный математик Елена Сергеевна Вентцель, кроме научной и преподавательской деятельности, также писала художественную литературу под псевдонимом И. Грекова). Более конкретные сведения о приложении методов математической статистики к задачам метрологии и обработки экспериментальных данных, в том числе с использованием компьютера, вы можете найти, например, в . Мы же остановимся на главном - расчете случайной погрешности.

В основе математической статистики лежит понятие о нормальном распределении. Не следует думать, что это нечто заумное - вся теория вероятностей и матстатистика, как прикладная дисциплина, в особенности, основаны на здравом смысле в большей степени, чем какой-либо другой раздел математики.

Не составляет исключения и нормальный закон распределения, который наглядно можно пояснить так. Представьте себе, что вы ждете автобус на остановке. Предположим, что автопарк работает честно, и надпись на табличке «интервал 15 мин» соответствует действительности. Пусть также известно, что предыдущий автобус отправился от остановки ровно в 10:00. Вопрос - во сколько отправится следующий?

Как бы идеально ни работал автопарк, совершенно ясно, что ровно в 10:15 следующий автобус отправится вряд ли. Пусть даже автобус выехал из парка по графику, но тут же был вынужден его нарушить из-за аварии на перекрестке. Потом его задержал перебегающий дорогу школьник. Потом он простоял на остановке из-за старушки с огромной клетчатой сумкой, которая застряла в дверях. Означает ли это, что автобус всегда только опаздывает? Отнюдь, у водителя есть план, и он заинтересован в том, чтобы двигаться побыстрее, потому он может кое-где и опережать график, не гнушаясь иногда и нарушением правил движения. Поэтому событие, заключающееся в том, что автобус отправится в 10.15, имеет лишь определенную вероятность, не более.

Если поразмыслить, то станет ясно, что вероятность того, что следующий автобус отправится от остановки в определенный момент, зависит также от того, насколько точно мы определяем этот момент. Ясно, что вероятность отправления в промежутке от 10.10 до 10.20 гораздо выше, чем в промежутке от 10.14 до 10.16, а в промежутке от 10 до 11 часов оно, если не возникли какие-то форс-мажорные обстоятельства, скорее всего, произойдет наверняка. Чем точнее мы определяем момент события, тем меньше вероятность того, что оно произойдет именно в этот момент, и в пределе вероятность того, что любое событие произойдет ровно в указанный момент времени, равна нулю.

Такое кажущееся противоречие (на которое, между прочим, обращал внимание еще великий отечественный математик Колмогоров) на практике разрешается стандартным для математики способом: мы принимаем за момент события некий малый интервал времени 5/. Вероятность того, что событие произойдет в этом интервале, уже равна не нулю, а некоей конечной величине бЛ а их отношение 5P/5t при устремлении интервала времени к нулю равна для данного момента времени некоей величине /?, именуемой плотностью распределения вероятностей. Такое определение совершенно аналогично определению плотности физического тела (в самом деле, масса исчезающе малого объема тела также стремится к нулю, но отношение массы к объему конечно) и потому многие понятия математической статистики имеют названия, заимствованные из соответствующих разделов физики.

Правильно сформулированный вопрос по поводу автобуса звучал бы так: каково распределение плотности вероятностей отправления автобуса во времени? Зная эту закономерность, мы можем всегда сказать, какова вероятность того, что автобус отправится в определенный промежуток времени.

Интуитивно форму кривой распределения плотности вероятностей определить несложно. Существует ли вероятность того, что конкретный автобус отправится, к примеру, позже 10:30 или, наоборот, даже раньше предыдущего автобуса? А почему нет - подобные ситуации в реальности представить себе очень легко. Однако ясно, что такая вероятность намного меньше, чем вероятность прихода «около 10:15». Чем дальше в обе стороны мы удаляемся от этого центрального наиболее вероятного срока, тем меньше плотность вероятности, пока она не станет практически равной нулю (то, что автобус задержится на сутки - событие невероятное, скорее всего, если такое случилось, вам уже будет не до автобусов). То есть распределение плотностей вероятностей должно иметь вид некоей колоколообразной кривой.

В теории вероятностей доказывается, что при некоторых предположениях относительно вероятности конкретных исходов нашего события, эта кривая будет иметь совершенно определенный вид, который называется нормальным распределением вероятностей или распределением Гаусса. Вид кривой плотности нормального распределения и соответствующая формула показаны на рис. 13.5.

Рис. 13.5. Плотность нормального распределения вероятностей

Далее мы поясним смысл отдельных параметров в этой формуле, а пока ответим на вопрос: действительно ли реальные события, в частности, интересующие нас ошибки измерения, всегда имеют нормальное распределение? Строгого ответа на этот вопрос в общем случае нет, и вот по какой причине. Математики имеют дело с абстракциями, считая, что мы уже имеем сколь угодно большой набор отдельных реализаций события (в случае с автобусом это была бы бесконечная таблица пар значений «плотность вероятности - время»). В реальной жизни такой ряд невозможно получить не только потому, что для этого потребовалось бы бесконечно долго стоять около остановки и отмечать моменты отправления, но и потому, что стройная картина непрерывного ряда реализаций одного события (прихода конкретного автобуса) будет в конце концов нарушена совершенно не относящимися к делу вещами: маршрут могут отменить, остановку перепестри, автопарк обанкротится, не выдержав конкуренции с маршрутными такси… да мало ли что может произойти такого, что сделает бессмысленным само определение события.

Однако все же интуитивно понятно, что, пока автобус ходит, какое-то, пусть теоретическое, распределение имеется. Такой идеальный бесконечный набор реализаций данного события носит название генеральной совокупности. Именно генеральная совокупность при некоторых условиях может иметь, в частности, нормальное распределение. В реальности же мы имеем дело с выборкой из этой генеральной совокупности. Причем одна из важнейших задач, решаемых в математической статистике, состоит в том, чтобы имея на руках две разных выборки, доказать, что они принадлежат одной и той же генеральной совокупности - проще говоря, что перед нами есть реализации одного и того же события. Другая важнейшая для практики задача состоит в том, чтобы по выборке определить вид кривой распределения и ее параметры.

На свете сколько угодно случайных событий и процессов, имеющих распределение, совершенно отличное от нормального, однако считается (и доказывается с помощью т. н. центральной предельной теоремы), что в интересующей нас области ошибок измерений при большом числе измерений и истинно случайном их характере, все распределения ошибок - нормальные. Предположение о большом числе измерений не слишком жесткое - реально достаточно полутора-двух дес5Гтков измерений, чтобы все теоретические соотношения с большой степенью точности соблюдались на практике. А вот про истинную случайность ошибки каждого из измерений можно говорить с изрядной долей условности: неслучайными их может сделать одно только желание экспериментатора побыстрее закончить рабочий день. Но математика тут уже бессильна.

Полученные опытным путем характеристики распределения называются оценками параметров, и, естественно, они будут соответствовать «настоящим» значениям с некоторой долей вероятности - наша задача и состоит в том, чтобы определить интервал, в котором могут находиться отклонения оценок от «истинного» значения и соответствующую ему вероятность. Но настало время все же пояснить - что же это за параметры?

в формуле на рис. 13.5 таких параметра два- величины ц и а. Они называется моментами нормального распределения (аналогично моментам распределения масс в механике). Параметр ц называется математическим ожиданием (или моментом распределения первого порядка), а величина а - средним квадратическим отклонением. Нередко употребляют его квадрат, обозначаемый как D или просто и носящий название дисперсии (или центрального момента второго порядка).

Математическое ожидание есть абсцисса максимума кривой нормального распределения (в нашем примере с автобусом это время 10:15), а дисперсия, как видно из рис. 13.5, характеризует «размытие» кривой относительно этого максимума- чем больше дисперсия, тем положе кривая. Этим моменты имеют прозрачный физический смысл (вспомните аналогию с фи^зическим распределением плотностей): математическое ожидание есть аналогия центра масс некоего тела, а дисперсия характеризует распределение масс относительно этого центра (хотя распределение плотности материи в физическом теле далеко от нормального распределения плотности вероятности).

Оценкой гпх математического ожидания ц служит хорошо знакомое нам со школы среднее арифметическое:

Здесь п- число измерений; /- текущий номер измерения (/= l,…,w); дс/ - значение измеряемой величины в /-м случае.

Оценка дисперсии вычисляется по формуле:

(2)

Оценка среднего квадратического отклонения, соответственно, будет:

Здесь (jc, – гПх) - отклонения конкретных измерений от ранее вычисленного среднего.

Следует особо обратить внимание, что сумму квадратов отклонений делить следует именно на « – 1, а не на «, как может показаться на первый взгляд, иначе оценка получится смещенной. Второе, на что следует обратить внимание - разброс относительно среднего характеризует именно среднее квадра-тическое отклонение, вычисленное по формулам (2) и (3), а не среднее арифметическое отклонение, как рекомендуют в некоторых школьных справочниках - последнее дает заниженную и смещенную оценку (не напоминает ли вам это аналогию со средним арифметическим и действующим значениями переменного напряжения?).

Заметки на полях

Кроме математического ожидания, средние значения распределения вероятностей характеризуют еще величинами, называемыми модой и медианой. В случае нормального распределения все три величины совпадают, но в других случаях они могут оказаться полезными: мода есть абсцисса наивероят-нейшего значения (то есть максимума на кривой распределения, что полностью отвечает бытовому понятию о моде), а медиана выборки есть такая точка, что половина выборки лежит левее ее, а вторая половина - правее.

В принципе этими формулами для расчета случайных погрешностей можно было бы ограничиться, если бы не один важный вопрос: оценки-то мы получили, а вот в какой степени они отвечают действительности? Правильно сформулированный вопрос будет звучать так: какова вероятность того, что среднее арифметическое отклоняется от «истинного» значения (то есть математического ожидания) не более чем на некоторою величину 8 (например, на величину оценки среднего квадратического отклонения s)?

Величина 5 носит название доверительного интервала, а соответствующая вероятность - доверительной вероятностью (или надежностью). Обычно решают задачу, противоположную сформулированной: задаются величиной надежности и вычисляют доверительный интервал 5. В технике принято задаваться величиной надежности 95%, в очень уж серьезных случаях - 99%. Простейшее правило для обычных измерений в этом случае таково: при уело-вии достаточно большого числа измерений (практически - более 15-20) доверительной вероятности в 95% соответствует доверительный интервал в 2Sy а доверительной вероятности в 99% - доверительный интервал в 3s. Это известное правило «трех сигма», согласно которому за пределы утроенного квадратического отклонения не выйдет ни один результат измерения, но на практике это слишком жесткое требование. Если мы не поленимся провести не менее полутора десятков отдельных измерений величины дс, то с чистой совестью можем записать, что результат будет равен

При этом предварительно из вариационного ряда исключают признаки, содержащие систематические ошибки и промахи. Для этого определяют предельную случайную погрешность по формуле С. В. Башинского, 1

Другое дело систематические ошибки - они являются неслучайными и имеют определенную направленность. Такие ошибки очень опасны, так как приводят к искажению результатов статистического исследования . Эти ошибки, как правило, являются преднамеренными. Известно, например, что люди предпочитают преуменьшать свои доходы, округлять возраст, стараются показать большую осведомленность в области культуры, науки, чем это есть на самом деле. Предприятия также могут внести элементы недостоверности в свою информацию, особенно в те характеристики, от которых зависят величина налоговых платежей, расчеты с кредиторами и т. п. Все ошибки такого рода необходимо выявить и исправить. Поэтому после проверки полноты данных проводится их контроль - счетный и логический.

Ошибки регистрации - это отклонения между значением показателя, полученного в ходе статистического наблюдения , и фактическим, действительным его значением. Такой вид ошибок имеет место и при сплошном, и при несплошном наблюдениях. Ошибки регистрации бывают случайными и систематическими. Случайные ошибки - это результат действия различных случайных факторов (например, цифры переставлены местами, перепутаны соседние строки или графы при заполнении статистического формуляра). Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения , и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Примером статистической ошибки регистрации при проведении социологических опросов может служить округление возраста населения, как правило, на цифрах, оканчивающихся на 5 и 0. Многие

Систематические ошибки репрезентативности появляются вследствие нарушения принципов отбора единиц из исходной совокупности, которые должны быть подвергнуты наблюдению. Для устранения ошибок наблюдения необходимо осуществить контроль полученной информации.

Однако может оказаться, что данные о доходе, полученные в результате опроса, на самом деле являются искаженными, - например, в среднем заниженными, т.е. объясняющие переменные измеряются с систематическими ошибками. В этом случае люди, действительно обладающие доходом X, будут на самом деле тратить на исследуемый товар в среднем величину , меньшую, чем ДА), т.е. в рассмотренном примере объ-

Определение стандартных затрат имеет ряд недостатков, например, возможны систематические ошибки в определении нормативов и деструктивный результат от задания неадекватных норм и стандартов.

Если систематические ошибки (износ режущего инструмента , температурные деформации и т. д.) приводят к смещению средних значений , то применяются контрольные диаграммы для среднего значения или для медиан. Если же систематические ошибки приводят к увеличению разброса параметров,

Это означает, что отсутствует систематическая ошибка в определении линии регрессии , следовательно оценки параметров регрессии являются несмещенными, то есть математическое ожидание оценки каждого параметра равно его истинному значению.

В противном случае мы принимаем гипотезу HI. Это означает, что при заданном уровне значимости в уравнении регрессии присутствует систематическая ошибка, и это уравнение должно быть уточнено.

Текущие процедуры матричной оценки вторичных ценных бумаг , выпущенных на базе пула ипотек, подвергались критике за неадекватный учет возможностей, предоставляемых этими ценными бумагами (таких, как предоставляемая домовладельцам возможность производить авансовые выплаты по закладным в рассрочку). Эта возможность имеет свою внутреннюю стоимость , и то, что модель не в состоянии адекватно включить ее в цену вторичной ценной бумаги , порождает систематические ошибки.

В принципе надо учитывать только случайные потери, не поддающиеся прямому расчету, непосредственному прогнозированию и потому не учтенные в предпринимательском проекте. Если потери можно заранее предвидеть, то они должны рассматриваться не как потери, а как неизбежные расходы и входить в расчетную калькуляцию. Так, предвидимое движение цен, налогов, их изменение в ходе осуществления хозяйственной деятельности предприниматель обязан учесть в бизнес-плане методов расчета предпринимательской деятельности или недостаточно глубокой проработки бизнес-плана систематические ошибки могут рассматриваться как потери в том смысле что они способны изменить ожидаемый результат в худшую сторону. Следовательно, прежде, чем оценивать риск, обусловленный действием сугубо случайных факторов , крайне желательно отделить систематическую составляющую потери от случайных.

В рассмотренных показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия , которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений п. Если число параметров при х - равно от и приближается к объему наблюдений , то остаточная дисперсия будет близка к нулю и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи , используется скорректированный индекс (коэффициент) множественной корреляции.

Экспериментальные торговые районы были выбраны случайным образом из числа разрешенных, и таким же образом были сформированы 27 комбинаций условий. Очевидно, что использование заданного перечня районов могло внести систематическую ошибку в наши результаты, но мы надеялись, что и на этот раз

При изучении правильности устанавливается общая приемлемость данного способа измерения (шкалы или системы шкал). Непосредственно понятие правильности связано с возможностью учета в результате измерения различного рода систематических ошибок. Систематические ошибки имеют некоторую стабильную природу возникновения либо они являются постоянными, либо меняются по определенному закону. Возможно, что последующие этапы окажутся излишними, если в самом начале выяснится полная неспособность данного инструмента на требуемом уровне дифференцировать изучаемую совокупность, иначе говоря, если окажется, что систематически не используется какая-то часть шкалы либо та или иная градация шкалы или вопроса. И, наконец, возможно, что исходный признак не обладает дифференцирующей способностью в отношении объекта измерения. Прежде всего нужно ликвидировать или уменьшить такого рода недостатки шкалы и только затем использовать ее в исследовании.

Надежность. При изучении различных аспектов разработки и использования тестов важную роль играет анализ ошибок измерения, ибо при составлении тестов, как и в любой работе, возможны ошибки. Обычно выделяют три класса ошибок промахи, систематические ошибки и случайные ошибки.

Систематические ошибки остаются постоянными или закономерно меняются от измерения к измерению и в силу этих особенностей могут быть предсказаны заранее, а в некоторых случаях и устранены. К этой группе относятся ошибки, возникающие в связи с использованием различных методов сбора данных.

Систематическую ошибку можно устранить, изменив процедуру формирования выборки. Случайная же ошибка будет присутствовать всегда, при любом выборочном опросе для общего результата значительно опаснее систематическая, так как по выборке ее невозможно выявить и оценить. Случайная ошибка подчиняется определенным законам и, используя статистические методы , ее можно оценить.

Правильность анализа определяется близостью к нулю его систематической ошибки (отклонением математического ожидания серии измерений от истинного значения).

Правильность анализа характеризуется близостью к нулю его систематической ошибки, оцениваемой по результатам внешнего геологического контроля. При внешнем контроле повторный (контрольный) анализ проб выполняется в другой, более квалифицированной лаборатории. Критерием правильности анализов служит при этом величина t

Средние содержания ценных компонентов обычно рассчитывают способом взвешивания по мощности. Однако при подсчете часто приходится иметь дело со столовыми (видимыми) значениями мощности, причем пересчет их в истинные значения не всегда может быть осуществлен достаточно надежно. Расчет средних при этом обычно ведут со взвешиванием по значениям стволовых мощностей. Такое взвешивание может приводить к систематическим ошибкам, если между углами встречи тела полезного ископаемого выработками и качеством сырья в отдельных его частях возникает некоторая связь. Так, на полиметаллическом месторождении Степное (Казахстан) вертикальные скважины закономерно пересекали среднюю часть седловидной залежи под углами, близкими к прямому, а фланговые части - под более острыми углами, что определяло повышенные значения стволовых мощностей на флангах и пониженные в центре (рис. 3.8). Однако фланговые части залежи на крыльях антиклинали как раз характеризовались пониженным качеством руд. Взвешивание по стволовым мощностям приводило в данном случае к занижению среднего качества руд по залежи в целом. Аналогичные погрешности могут возникать при разведке неоднородных по качеству сырья линейных тел веерными скважинами.

Особенно необходимо учитывать случайные потери, не поддающиеся прямому расчету, непосредственному прогнозированию и потому неучтенные в предпринимательском проекте. Если потери можно заранее предвидеть, то они должны рассматриваться не как потери, а как неизбежные расходы и включаться в расчетную калькуляцию. Так, предвидимое движение цен, налогов, их изменение в ходе осуществления хозяйственной деятельности необходимо учесть в бизнес-плане . Только в силу несовершенства используемых методов расчета производственной деятельности систематические ошибки могут рассматриваться как потери в том смысле, что они способны изменить в худшую сторону ожидаемый результат.

Задача может быть модифицирована и обобщена в различных направлениях. Жесткое ограничение - несмещенность оценки (равенство нулю систематической ошибки) обычно можно ослабить и заменить ограничениями сверху и снизу величины первого момента ошибок про-

Свяжем с задачей А задачу А" прогнозирования по минимуму дисперсии при [нулевых систематических ошибках прогноза. Задача А формулируется следующим образом.

Увольнение в связи с обнаружившимся несоответствием рабочего или служащего занимаемой должности или выполняемой работе вследствие недостаточной квалификации либо состояния здоровья, препятствующих продолжению данной работы (п. 2 ст. 33 КЗоТ). Признаками несоответствия вследствие недостаточной квалификации могут быть систематические ошибки при выполнении порученной работнику работы, невыполнение нормы выработки , брак и т. п. Расторжение трудового договора в случаях, предусмотренных в п. 2 ст. 33 КЗоТ, недопустимо с работниками, не имеющими необходимого опыта работы в связи с непродолжительностью трудового стажа , а также по мотиву отсутствия специального образования, если оно, согласно закону, не является обязательным условием при заключении трудового договора (79, п. И).

Оба вида ошибок могут иметь случайный и систематический характер. Случайные ошибки возникают по разным случайным причинам (описка, пропуск, неточный подсчет и т. д.) и воздействуют на точность данных как в сторону их увеличения, так и уменьшения. При достаточно большом количестве наблюдений согласно закону больших чисел эти ошибки взаимно погашаются и не оказывают существенного влияния на точность наблюдений. Систематические ошибки возникают по какой-либо определенной причине и вызывают одностороннее изменение данных (ошибки программы наблюдений, нарушение принципов отбора объектов наблюдения и т. п.), искажая их. Мерами предупреждения этих ошибок является правильное определение количества наблюдений , обоснованный выбор объектов наблюдения и др.

Такая же опасность возникает при замене по какой-либо причине единиц, попавших в выборку, другими единицами (например, вместо отобранного домохозяйства, где в момент прихода интервьюера никто не открыл дверь, был проведен опрос в соседней квартире или интервьюер встретил решительный отказ участвовать в опросе и был вынужден пойти на замену домохозяйства). Как отмечает социолог В. И. Паниотто, систематические ошибки представляют собой некоторое постоянное смещение, которое не уменьшается с увеличением числа опрошенных и вызвано недостатками и просчетами в системе отбора респондентов. Если, например, для изучения общественного мнения жителей города в архитектурном управлении получить сведения о жилом фонде и из всех имеющихся в городе квартир отобрать случайным образом 400 квартир, а затем предложить интервьюерам опросить всех, кого они застанут в момент посещения в этих квартирах, то полученные данные не будут репрезентативны. Допущена систематическая ошибка более подвижная часть населения попадает в выборку в меньшей пропорции, а менее подвижная - в большей пропорции, чем в генеральной совокупности . Пенсионеров, например, можно чаще застать дома, чем студентов-вечерников. При увеличении выборки эта ошибка не устраняется если мы проведем опрос в 800 квартирах или даже во всех квартирах города (сплошной опрос), то полученные данные будут репрезентативны для населения, находящегося дома в момент прихода интервьюера, а не для всех жителей города.

Чтобы минимизировать систематическую ошибку, возникающую при оптимизации, мы ограничились простым перекрестным правилом скользящих средних (СМА = rossing-Moving-Averages) - это правило торговли пропагандируют Брок и др. . Правило очень простое в том отношении, что в вычислении индикатора не участвуют числа Фибоначчи . Здесь важно, что технический анализ стремится предсказать, главным образом, направление изменения цены (вниз, вверх, на том же уровне), а не величину этого изменения.

Можно еще дальше усовершенствовать эксперимент, связанный с определением урожайности культуры и зависимый от качества обработки почвы. Если каждого рабочего закрепить за определенным полем, то вследствие различности почв может появиться систематическая ошибка. Обозначим поля буквами W, X, У, ZH определим условия эксперимента рабочих между полями таким образом, чтобы каждый из них обслуживал поле только один день . В этом случае получим план, называемый греко-латинским квадратом , который позволяет усреднить влияние таких факторов, как день, поле, рабочий (табл. 4.6).

СИСТЕМАТИЧЕСКАЯ ОШИБКА - понятие математической статистики - ошибка, которая постоянно либо преувеличивает, либо преуменьшает результаты измерений оценок наблюдаемых величин) в результате воздействия определенных факторов, систематически влияющих на эти измерения и изменяющих их в одном направлении (в отличие от случайных ошибок). Оценки, лишенные систематических ошибок, называются несмещенными оценками.

Расчетное значение критерия t сравнивается с табличным значением статистического критерия Стьюдента для данного числа пар и выбранного уровня значимости. Систематическая ошибка считается отсутствующей, если tpa 4

Однострелочные секундомеры простого действия используют для измерения элементов операций по отдельным отсчетам затрат времени при выборочном и цикловом методах хронометража. Они имеют одну основную центральную стрелку, движущуюся по круговому циферблату, шкала которого может иметь секундную или деся- тичную градуировку. Пределы измерения шкалы 30 или 60 с. Секундомер может иметь один или два дополнительных счетчика для отсчета целого числа минут, прошедших с момента начала наблюдения. Их недостаток - малая точность при хронометрировании по текущему времени вследствие накопления систематической ошибки, вызываемой накапливанием запаздываний в пуске стрелки после считывания показаний. Этого недостатка лишен однострелочный секундомер суммирующего действия. Но он более сложен по конструкции и менее надежен в работе.

Минимизация систематической ошибки . Практическое использование излагаемых выше предложений по повышению устойчивости оценок коэффициентов регрессии наталкивается на следующие неопределенности. Какую минимизируемую функцию риска выбрать Все предлагаемые оценки содержат параметры v - в п. 7.2.1, k - в п. 7.2.2 и К - в п. 7.2.3 и 7.2.4. Какими брать значения этих параметров Если полезно уменьшать веса больших отклонений прогнозируемой переменной, то, может быть, полезно взвешивать и предикторные переменные

Понятие, показывающее, что выводы, сделанные применительно к какой-либо группе, могут оказаться неточными вследствие неправильного отбора в эту группу.

Ошибки отбора результатов

Могут включать предварительный или последующий отбор с превалированием или исключением некоторых видов. Это может быть, конечно, разновидностью научного мошенничества , манипуляцией данными, но гораздо чаще является добросовестным заблуждением, например, вследствие использования неподходящего инструмента.

Например, в эпоху использования плёнки для фотографирования неба независимый наблюдатель определённо пришёл бы к выводу, что количество голубых галактик явно больше, чем количество красных. Не потому, что голубые галактики более распространены, но лишь вследствие того, что большинство плёнок более чувствительны к голубой части спектра. Тот же независимый наблюдатель сделал бы прямо противоположный вывод сейчас, в эпоху цифровой фотографии, потому что матрицы цифровых фотоаппаратов более чувствительны к красной части спектра.

Типы систематических ошибок

Существует большое количество возможных систематических ошибок, основные типы:

Пространство

Выбор первой и последней точки в серии. К примеру, для того, чтобы максимизировать заявленный тренд, можно начать серию с года с необычно низкими показателями и закончить годом с самыми высокими показателями.
«Своевременное» окончание, то есть тогда, когда результаты укладываются в желаемую теорию.
Отделение части данных на основе знаний обо всей выборке и затем применение математического аппарата к этой части как к слепой (случайной) выборке. См. Районированная выборка , en:cluster sampling , Ошибка меткого стрелка .
Изучение процесса на интервале (во времени или пространстве) длиной заведомо меньшей, чем требуется для полного представления о явлении.

Данные

Вычёркивание неких «плохих» данных в соответствии с правилами, хотя бы эти правила и шли вразрез с предварительно объявленными правилами для этой выборки.

Участники

Предварительный отбор участников, или, к примеру, размещение объявления о наборе добровольцев для участия в испытаниях среди определённой группы людей. К примеру, для доказательства, что курение никак не вредит результатам фитнеса, можно разместить в местном фитнесцентре объявление для набора добровольцев, но курящих набирать в мастерклассе, а некурящих среди начинающих или в секции желающих сбросить вес. Например: «интернет-опрос населения показал, что 100 % населения пользуются Интернетом».
Выбрасывание из выборки участников, не дошедших до конца теста . В программе похудения мы рассматриваем подробные графики сброса веса как доказательство правильности методики, но в эти графики не включены не дошедшие до конца участники, посчитавшие, что на них эта методика не работает.
Систематическая ошибка самоотбора. То есть группа людей для изучения формируется частично по собственной воле, так как не все опрошенные пожелают участвовать в тесте.

Ошибки измеренийподразделяются на систематические и случайные.

Величина систематических ошибок одинакова во всех измерениях, проводящихся одним и тем же методом с помощью одних и тех же измерительных приборов. Различают четыре группы систематических ошибок:

1) ошибки, причина возникновения которых известна и величина которых может быть определена достаточно точно. Например, при определении результата прыжка рулеткой возможно изменение её длины за счёт различий в температуре воздуха. Это изменение можно оценить и ввести поправки в измеренный результат;

2) ошибки, причина возникновения которых известна, а величина нет. Такие ошибки зависят от класса точности измерительной аппаратуры. Например, если класс точности динамометра для измерения силовых качеств спортсменов составляет 2.0, то его показания правильны с точностью до 2% в пределах шкалы прибора. Но если проводить несколько измерений подряд, то ошибка в первом из них может быть равной 0,3%, а во втором – 2%, в третьем – 0,7% и т. д. При этом точно определить её значения для каждого из измерений нельзя;

3) ошибки, происхождение которых и величина неизвестны. Обычно они проявляются в сложных измерениях, когда не удаётся учесть все источники возможных погрешностей;

4) ошибки, связанные не столько с процессом измерения, сколько со свойствами объекта измерения. Как известно, объектами измерений в спортивной практике являются действия и движения спортсмена, его социальные, психологические, биохимические и т. п. показатели. Измерения такого типа характеризуются определённой вариативностью, и в её основе может быть множество причин. Рассмотрим следующий пример. Предположим, что при измерении времени сложной реакции хоккеистов используется методика, суммарная систематическая погрешность которой по первым трём группам не превышает 1%. Но в серии повторных измерений конкретного спортсмена получаются такие значения времени реакции (ВР): 0,653 с; 0,526 с; 0,755 с и т. д. Различия в результатах измерений обусловлены внутренними свойствами спортсменов: один из них стабилен и реагирует практически одинаково быстро во всех попытках, другой – нестабилен. Однако и эта стабильность (или нестабильность) может измениться в зависимости от утомления, эмоционального возбуждения, повышения уровня подготовленности.

Систематический контроль за спортсменами позволяет определить меру их стабильности и учитывать возможные погрешности измерений.

В некоторых случаях ошибки возникают по причинам, предсказать которые заранее невозможно. Такие ошибки называются случайными. Их выявляют и учитывают с помощью математического аппарата теории вероятностей.

Перед проведением любых измерений нужно определить источники систематических погрешностей и по возможности устранить их. Но так как полностью это сделать нельзя, то внесение поправок в результат измерения позволяет исправить его с учётом систематической погрешности.

Для устранения систематической погрешности используют:

а) тарирование – проверку показаний измерительных приборов путём сравнения их с показаниями эталонов во всём диапазоне возможных значений измеряемой величины;

б) калибровку – определение погрешностей и величины поправок.

Под случайными величинами понимают числовые характеристики случайных событий. Другими словами, случайные величины – это числовые результаты экспериментов, значения которых которые невозможно (в данное время) предсказать заранее. Случайные величины делят на дискретные и непрерывные в зависимости от того, каково множество всех возможных значений соответствующей характеристики – дискретное или же непрерывное.

Это деление довольно условно, но полезно при выборе адекватных методов исследования.

Случайные величины можно задавать разными способами. Дискретные случайные величины обычно задаются своим законом распределения. Тут каждому возможному значению x1, x2,... случайной величины X сопоставляется вероятность p1,p2,... этого значения. В результате образуется таблица, состоящая из двух строк:

Это и есть закон распределения случайной величины. Непрерывные случайные величины законом распределения задать невозможно, так как по самому своему определению их значения невозможно перенумеровать и потому задание в виде таблицы тут исключается. Однако для непрерывных случайных величин есть другой способ задания (применимый, кстати, и для дискретных величин) –это функция распределения:

равная вероятности события , которое состоит в том, что случайная величина X примет значение, меньшее заданного числа x.

14 При обработке данных используют такие характеристики случайной величины Х как моменты порядка q, т.е. математические ожидания случайной величины Xq, q = 1, 2, … Так, само математическое ожидание – это момент порядка 1. Для дискретной случайной величины момент порядка q может быть рассчитан как

Для непрерывной случайной величины

Моменты порядка q называют также начальными моментами порядка q, в отличие от родственных характеристик – центральных моментов порядка q, задаваемых формулой

Вопрос.

Диспе́рсия случа́йной величины́ - мера разброса данной случайной величины, то есть её отклонения от математического ожидания

Дисперсией дискретной случайной величины называют сумму квадратов отклонения значений случайной величины от своего математического ожидания. Дисперсия показывает величину разброса значений случайной величины от своего математического ожидания.

Пусть - случайная величина, определённая на некотором вероятностном пространстве. Тогда

D{X}=M [|X-M[X]| 2 ] , где символ M обозначает математическое ожидание.

Дисперсия любой случайной величины неотрицательна:

Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;

Если случайная величина равна константе, то её дисперсия равна нулю

Дисперсия суммы двух случайных величин равна: , где - их ковариация;

Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности, а сам интервал - доверительным интервалом. Каждой доверительной вероятности соответствует свой доверительный интервал. Однако это утверждение справедливо только при достаточно большом числе измерений (более 10), да и вероятность 0,67 не представляется достаточно надежной - примерно в каждой из трех серий измерений a может оказаться за пределами доверительного интервала. Для получения большей уверенности в том, что значение измеряемой величины лежат внутри доверительного интервала, обычно задаются доверительной вероятностью 0,95 - 0,99. Доверительный интервал для заданной доверительной вероятности учетом влияния числа измерений n можно найти, умножив стандартное отклонение среднего арифметического на так называемый коэффициент Стьюдента.

Систематическая ошибка - ошибка исследования, не связанная с выборкой. Она может быть вызвана концептуальными или логическими ошибками, неправильной интерпретацией ответов, а также статистическими, арифметическими, табуляционными, кодовыми или отчетными ошибками.Систематические ошибки подразделяется на: случайные(дают оценки, отличные от истинного значения; они могут приводить к отклонениям и в большую, и в меньшую сторону и имеют при этом случайный характер) и неслучайные(приводят к односторонним отклонениям, для них характерна тенденция к смещению выборочного значения относительно параметра совокупности). Недостатки систематических ошибок: - не так часты, но и не настолько подконтрольны, как ошибки в выборке;- в систематических ошибках, как направление, так и величина ошибки могут оказаться совершенно непредсказуемыми, в отличие от выборок, где ошибки в выборке при использовании вероятностных методов могут быть оценены; - приводят к смещению выборочного значения относительно параметра совокупности;- влияют на достоверность выборочных оценок. Особенно критичными ошибки становятся при работе с широкомасштабными, хорошо продуманными вероятностными выборками, т.к. при увеличении эффективности проектирования выборки и уменьшении выборочной дисперсии, эффект систематических ошибок усиливается. Чем эффективнее составлена выборка, тем большую роль играют систематические ошибки и тем меньшим смыслом обладают вычисления по определению доверительного интервала, в основе которых лежат обычные формулы. Систематические ошибки делятся на два основных типа: ошибки, связанные с неполучением данных (ошибки ненаблюдения), и ошибки наблюдения. Ошибки ненаблюдения возникают вследствие невозможности получения данных от части элементов обследуемой совокупности и быть вызваны тем, что часть обследуемой совокупности не была представлена в выборке, или же элементы, отобранные для включения в выборку, не представили данных. Ошибки наблюдений возникают вследствие некорректной информации, полученной от элементов выборки, они могут возникнуть и на стадии обработки данных или формулирования итогового вывода.

48.Понятие и сущность ошибок ненаблюдения. Существуют два типа ошибок ненаблюдения: ошибки неохвата( систематическая ошибка, являющаяся следствием того, что определенные части или целые блоки генеральной совокупности не были включены в основу выборки) и ошибки неполучения данных. Неохват может стать источником серьезных неточностей, при этом ошибка неохвата относится только к ошибочно выпавшим из рассмотрения частям совокупности. Таким образом, проблема неохвата имеет отношение к основе выборки.Ошибка перебора может возникать из-за возникновения повторов в сводке элементов выборки.Ошибки неохвата:1) относятся к разряду систематических ошибок и потому не входят в стандартные стат. зависимос. ;2) как правило, не могут быть устранены посредством увеличения объема выборки;3) могут иметь существенный размер;4) могут быть уменьшены при осознании их наличия с помощью улучшения основы выборки и принятия ряда специальных мер, позволяющих до определенной степени компенсировать остаточное несовершенство основы. Ошибка неполучения данных – систематическая ошибка, порождаемая отсутствием информации о некоторых элементах, которые должны были войти в состав выборки. Для того, чтобы оптимизировать и стандартизировать практику исследований предлагается определение доли ответивших(отношение количества проведенных с респондентами интервью к количеству приемлемых респондентов в выборке). Различают две главные причины ошибки неполучения данных - это отсутствие и отказ от интервью. Отсутствие – систематическая ошибка, возник. вследствие неполучения ответов от заранее определенных респондентов, отсутствующих дома в момент звонка регистратора.Отказы от интервью – систематическая ошибка, возникающая вследствие того, что часть респондентов отказывается принимать участие в обследовании. Доля отказов зависит часто от особенностей респондентов, организаций, осуществляющих финансовое обеспечение обследования, обстоятельств контакта, темы обследования и искусства интервьюера.Стратегии, рекоменд. для корректировки ошибки:1. Увеличение доли первичных ответов (улучшение условий проведения интервью и углубленное обучение интервьюеров).2. Повторные попытки.3. Экстраполяция получ.информации(оценка возможного эффекта, обусловленного неполучением данных, и соответствующая коррекция результатов исследования).Частичное неполучение данных состоит в том, что респондент, согласившийся принять участие в опросе, не хочет или не может ответить на некоторые вопросы из-за специфики их формы или содерж. или вследствие нежелания обременять себя поиском инф.

49.Понятие и сущность ошибок наблюдения

Ошибка сбора – систематическая ошибка, возникающая при сборе данных.Человек отказ отвечать на одни и дает неправильные ответы на другие вопросы интервьюера - ошибками пропуска и ошибками свидетельства. Поведенческие факторы . Биографические данные, мнения, позиции, намерения респондента могут являться источниками ошибок. Существуют 3 модели поведения интервьюеров , которые приводят к появлению ошибок: ошибки при формулировке вопросов и неумение задавать уточняющие вопросы, ошибки при записи ответов, подтасовка данных.Достоверность:

1) Метод опроса - проверяется соответствие использованного метода заданному (например, действительно ли проводился персональный, а не телефонный опрос).

2) Поставленные вопросы - проверка того, не были ли выпущены из рассмотрения важные вопросы (демографического или классификационного характера).

3) Демонстрация продукции - проверка того, действительно ли была произведена потребная для проведения опроса демонстрация продукта или информационного листа.

4) Знакомство респондента с интервьюером - проверка того, не занимался ли интервьюер опросом своих знакомых или друзей.

5) Реакция на проведение опроса - проверка «качества» работы интервьюера.

Офисные ошибки . Систематические ошибки могут возникать не только при сборе информации. Они могут появляться при редактировании, кодировании, составлении таблиц и анализе данных.

Суммарные ошибки. Частные ошибки, складываясь, приводят к ошибке суммарной, которая и должна интересовать исследователей.

При работе с ошибками сбора данных можно воспользоваться схемой Кана- Кэннела

интервьюер респондент

Характеристики: Характеристики: теже что и у интер-ра

Возраст Психологические факторы:теже

Образование Поведенческие факторы:

Ответы на вопросы

(адекватные – неадекватные)

(точные – неточные)

Социально-экономический статус

Национальность,Религиозная принадлежность,Пол и т.д.

Психологические факторы: Восприятие,Позиция,Намерения,мотивы

Поведенческие факторы: Ошибки при вопросах,Ошибки при распределении типа респондентаОшибки мотивации,Ошибки при записи ответов

Личные особенности (характеристики). личные особенности могут серьезно повлиять на ответы. Психологические факторы . результаты работы интервьюеров имеют обусловленность их взглядами, позициями и стремлениями.

50.Редактирование данных. Редактирование включает в себя просмотр и, если необходимо, исправление каждой анкеты или формы регистрации наблюдений. Просмотр и внесение исправлений выполняются в 2 стадии: полевое редактирование и централизованное офисное редактирование.

Полевое редактирование - это предварительное редактирование, которое строится таким образом, чтобы обнаружить наиболее бросающиеся в глаза пропуски и неточности данных.

Оно также полезно для контроля поведения персонала полевых сил и внесения ясности. Полевое редактирование выполняется как можно скорее после того, как анкета заполнена. В этом случае проблемы могут быть устранены прежде, чем проводивший сбор информации будет расформирован. Полевое редактирование обычно выполняется руководителем полевых работ.

Централизованное офисное редактирование - всеобъемлющая проверка и коррекция заполненных форм сбора данных, включая принятие решения о том, что с этими данными делать.

Чтобы обеспечить логическую последовательность обработки материалов, лучше всего предоставить все носители собранных данных одному человеку. Если эту работу приходится делить по соображениям ее объема и имеющегося времени, подразделы должны определяться по частям анкеты, а не по респондентам. То есть, один редактор должен редактировать часть «А» всех анкет, а другой - часть «В».

В отличие от полевого, централизованное офисное редактирование в меньшей степенизависит от последующих процедур, и в большей - от степени полноты данных. При анализе необходимо решить, каким образом будут обрабатываться носители собранных данных, содержащие неполные ответы, явно неправильные ответы и ответы.

Вернувшиеся заполненные анкеты целиков. В некоторых окажутся пропущенными целые разделы. Другие будут оставленными без ответа отдельные позиции. Анкеты, в которых пропущены целые разделы, не должны отбрасываться автоматически. Тщательное редактирование анкеты иногда показывает, что ответ на какой-то вопрос очевидно неправилен.

При анализе необходимо не пропустить заполненные анкеты, которые неудачны с точки зрения интереса респондента. Свидетельства отсутствия интереса могут быть и очевидными, и очень трудно распознаваемыми.

51. Кодирование данных. Код-е – технический прием, с помощью которого данные распределяются по категориям. Прием связан со спецификацией альтернативных категорий или классов, в которые должны помещаться ответы, а самим классам должны назначаться кодовые номера.

I этап код-я заключается в специфицировании категорий или классов, к которым будут относиться ответы. Выбор ответов должен быть взаимоисключающим и исчерпывающим, чтобы каждый ответ логически попадал в одну категорию. Код-е закрытых вопросов и большинства средств балльной оценки не сложно; потому что оно устанавливается при конструировании самой анкеты. Код-е открытых вопросов более сложно и более дорогое, т.к. приходится определять подходящие категории на базе ответов, которые не всегда предсказуемы. Если анкет слишком много, и необходимо использовать для кодирования анкет нескольких кодировщиков, дополнительной проблемой может стать возникновение несоответствия в самом кодировании. Поэтому для получения логической последовательности обработки данных, эту работу необходимо разделять по задачам, а не в равных долях делить анкеты между кодировщиками.

II этап код-я касается назначения кодовых номеров классов. Принято, для обозначения классов использовать цифры, а не буквы. Когда для анализа данных предполагается использовать компьютер, кодирование необходимо выполнять таким образом, чтобы данные оказывались готовыми для ввода в машину, поэтому полезно обеспечить наглядность ввода посредством многоколонной записи. Когда вопрос допускает множество ответов, допускать отдельные колонки для кодирования каждого варианта ответа.

Необходимо использовать ровно столько колонок поля, назначаемого для переменной, сколько необходимо для полного охвата всех ее возможных значений. Кроме того, любому полю должна назначаться не более чем одна переменная.Рекомендуется применять стандартные коды для «отсутствия информации». Так, все ответы «не знаю» должны кодироваться цифрой 8, «нет ответов» - цифрой 9, а «не применялось» обозначаться как 0. Лучше, если во всем исследовании для каждого из этих типов «нет информации» используется один и тот же код.

Завершающий этап код-я состоит в подготовке книги кодов , которая содержит общие инструкции, указывающие, каким образом была закодирована каждая позиция данных. В ней перечисляются коды каждой переменной и категории, включенные в каждый код.

52.Табулирование данных. Табулирование заключается просто в подсчете количества событий, которые попадают в различные категории. Табулирование может принимать форму простой табуляции, или перекрестной табуляции . Простая табуляция - подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной переменной.Перекрестная табуляция - подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух и более переменных, рассматриваемых одновременно.Одномерная табуляция используется в следующих целях:

1. для определения степени безответности позиций анкеты является важной проблемой в большинстве исследований. Когда степень безответности большая, исследование в целом становится сомнительным и возникает необходимость пересмотреть его цели и методы. Возможно использование нескольких стратегий. - Оставить позиции пустыми и описать их количество как отдельную категорию. -Исключать событие с утраченной позицией при анализе с использованием соответствующей переменной. -Подставить значения утраченных позиций анкеты. 2. для локализации грубых ошибок . Грубая ошибка– ошибка, которая возникает при редактировании, кодировании, клавиатурном наборе или табулировании данных.3. для локализации посторонних значений- наблюдение, настолько отличающееся по величине от остальных наблюдений, что возникает необходимость обрабатывать его как особое значение.4. для определения эмпирического распределения рассматриваемой переменной. Лучше всего представить в виде гистограммы.5. для расчета итоговых статистик.

Перекрестная табуляция является важным механизмом для изучения связей внутри и между переменными. В перекрестной табуляции выборка делится на подгруппы. Связь между двумя переменными в пределах категорий размера семьи, называется условной таблицей , позволяющей обнаружить условную связь между переменными.Условные таблицы, построенные на основе одной регулируемой переменной, называются условными таблицами первого порядка . Таблицы, составленные с использованием двух регулируемых переменных, называются условными таблицами второго порядка .В настоящее время табулированные результаты чаще представляются в виде баннеров. Баннер – это последовательныйряд перекрестных табуляций между критерием и несколькими факторными переменными, оформленный в виде единой таблицы.

53.Традиционный, классический метод анализа документов и его составляющая.Традиционный анализ – это цепочка умственных, логических построений, направленных на выявление сути анализируемого материала с определенной, интересующей исследователя точки зрения в каждом конкретном случае. Основным недостатком этого анализа является субъективность. В традиционном анализе различают внешний и внутренний анализ. Внешний анализ – это анализ контекста документа и тех обстоятельств, которые сопутствовали его появлению. Цель внешнего анализа – установить вид документа, его форму, время и место появления, автора и инициатора, какие цели преследовались при его составлении, степень надежности и достоверности, каков его контекст. Внутренний анализ – это исследование содержание документа. Отдельные виды документов из-за своей специфики, требуют специальных методов анализа и привлечения для их выполнения специалистов других областей знаний. Юридический анализ. Он применяется для всех видов юридических документов. Его специфика заключается в том, что разработан особый словарь терминов, в котором значение каждого слова строго однозначно определено.Психологический анализ. Он применяется при оценке отношения автора к какому-либо политическому, экономическому или социальному явлению. На основе таких исследований можно получить представление о формировании общественного мнения, общественных установок и т.д.

54. Формализованный, количественный (контект-анализ) и его состав-е . Его называют часто количественный метод анализа документов (контент-анализ).Суть этих методов сводится к тому, чтобы найти легко подсчитываемые признаки, черты, свойства документа, которые отражали бы определенные существенные стороны содержания. Тогда качественное содержание делается измеримым, становится доступным для точных вычислений.Контент-анализ – это техника выделения заключения проводимого с помощью объективного и систематического выявления соответствующих характеристик текста задачам исследования. Существуют общие принципы, когда применяется контент-анализ:1. Когда требуется высокая степень точности или объективности анализа.2. При наличии большого по объему и несистематизированного материала.3. Когда категории, важные для целей исследования, характеризуются определенной частотой появления в изучаемых документах.Основными направлениями использования контент-анализа являются:

1. Выявление и оценка характеристик текста как индикаторов определенных сторон изучаемого объекта;2. Выявление причин, породивших сообщение; 3. Оценка эффекта воздействия сообщения (например, рекламного).Требование объективности анализа предполагает решение ряда проблем, связанных:1. с выработкой категорий анализа. Категории анализа – это понятие, в соответствии с которыми будут сортироваться единицы. Требования, предъявляемые к категориям:- должны быть исчерпывающими, - взаимоисключаемыми, - надежность.2.С выделение единиц анализа. Единицей анализа (смысловой или качественной) является та часть содержания, которая выделяется как элемент, подводимый под ту или иную категорию. Индикаторами могут быть:- относящиеся к теме слова и словосочетания;- термины;- имена людей;- названия организаций;- географические названия;- пути решения экономических проблем, 3. с выделение единиц счета. Единицы счета обладают разной степенью точности измерения, а так же разным временем, уходящим на кодировку материала, попавшего в выборку. В практике методом контент-анализа были выделены общие единицы счета, отвечающие различным исследовательским требованиям.1.Время – пространство. 2.Появление признаков в тексте

3.Частота появления. При разработке программы маркетинговых исследований необходимо четко определить, какого рода характеристики объекта подвергаются изучению, и в зависимости от этого оценивать документы с точки зрения их адекватности, надежности, достоверности.

Адекватность документа определяется как степень, в которой он отражает интересующие исследователя характеристики объекта.

Надежность оценивается сопоставлением всех данных содержания с какими-то другими данными. Здесь возможны несколько вариантов проверки:

1.Сравнение содержания документов , исходящих из одного источника. Такое сравнение может проводиться:а) во времени б) в различных ситуациях

в) в различных аудиториях .2.Метод независимых источников , т.е. выбираются характеристики из нескольких различных источников информации. Затем различия в характеристиках сравниваются с различиями в содержании сообщений.Оценка достоверности данных документа проводится путем последовательного перебора источников встречающихся в документе ошибок. Источники ошибок можно разделить на две категории:

Случайные (например, опечатки в статистических данных) -систематические.

Систематические ошибки делятся на сознательные и несознательные

Сознательные ошибки часто определяются теми намерениями, которыми руководствуется автор при составлении документа.