В заключение этого раздела отметим следующее. Стандартной процедурой в естественных науках является поиск закономерностей. Мы получаем набор чисел, чаще всего — зависимость некой функции от одной или нескольких переменных, и имеем в виду подобрать функцию, описывающую эти данные. Функция обычно подбирается в некотором классе (синусоиды, экспоненты, многочлены), причем выбор класса делается, исходя из наших исходных представлений о зависимости. Так вот, при подборе функции не имеет смысла делать так, чтобы полученные данные объяснялись точно — потому, что в этих «данных» смешаны действительные значения и погрешности. Подбор функций должен делаться так, чтобы она прошла через экспериментальные точки с учетом «полей допуска», то есть зацепила соответствующие прямоугольнички (x, ''x, y, ''y). Причем человеку свойственно преувеличивать достигнутую им точность. Поэтому Л.Д.Ландау говорил, что если вы провели зависимость через экспериментальные точки и собираетесь эту зависимость интерпретировать, то увеличьте погрешность в три раза и посмотрите — сохранится ли ваша интерпретация.
Характеристики: метрологические и не очень
У метрологического оборудования и приборов есть общетехнические и метрологические характеристики. Общетехнические — вес, объем, надежность, потребляемая мощность, ремонтопригодность, патентная чистота, приятность для взора, стоимость и другие. Все то, что можно сказать о любом техническом объекте или о большинстве из них.
Метрологические характеристики: какая величина измеряется; диапазон (или диапазоны) измерений; цена деления; все и всяческие погрешности — систематическая, аддитивная, мультипликативная, случайная; условия измерения и чувствительность к влияниям; динамические характеристики — время установления показаний, «мертвое время», частота замеров, гистерезис; для преобразователей — функция преобразования и ее стабильность; для цифровой техники — характеристики входного и выходного кода (число разрядов, цена единицы).
Обработка результатов измерений
Нет данных без обработки и нет обработки без предварительной информации. Когда мы измеряем тестером напряжение в сети, мы немедленно делаем свой вывод — «нормально» или «низковато для этого времени суток» или «почему так много, тестер барахлит, что ли». Обработка очевидна, причем довольно сложная. За счет чего она производится? За счет предварительной информации, что тоже очевидно.
Ситуации с многократными измерениями можно разделить на две группы. Первая — это когда мы многократно измеряем реально одну и ту же величину, например, вес одной и той же монетки. Полученный в этом случае разброс является свойством именно прибора. Вторая ситуация — когда мы изучаем разные «предъявления» одной и той же величины, но реально она может при разных предъявлениях оказаться и разной. Например, мы должны навести телескоп на звезду и проверяем, с какой ошибкой он наводится. В этом случае разброс результатов измерения складывается из разброса наведения («предъявления») и разброса прибора. Можно, впрочем, с некоторой натяжкой считать, что за весами разных реальных монеток стоит одна (идеальная) величина — номинальный вес. Особенность этой второй ситуации в том, что идеальная величина (номинальный вес или координаты звезды) нам известны, и мы изучаем «погрешности предъявления». При этом погрешности прибора должны быть существенно меньше, а вопрос об уменьшении погрешности «предъявления» стоит — но не перед нами. А перед разработчиками телескопа или штампа для монеток и монетного сплава. В первом случае можно задать вопрос о возможности уменьшения погрешности измерения одним и тем же прибором, и ниже мы к этому вопросу вернемся.
Итак, важный вопрос практической метрологии — сколько измерений делать. Обычно в книгах по метрологии пишут, что измерения должны проводиться многократно и долго обсуждают, достаточно ли двадцати, или лучше тридцать, а когда нужно три сотни. Хотел бы я посмотреть… то есть совсем наоборот! — не хотел бы увидеть, как мои коллеги звонят в скорую психиатрическую помощь, ибо я на их глазах начал мерить напряжение в сети или ток анода больше двух раз. Да и два-то зачем? На практике количество измерений зависит от априорной информации, например в производстве при контроле процесса или партии изделий обычно делают одно измерение. Для совершенно нового объекта и если мы хотим детально изучить функцию распределения, количество измерений может доходить до тысячи, особенно если мы хотим отловить отступления функции распределения от нормальной и использовать эту информацию для улучшения измерений. Обычная метрологическая рекомендация — делать измерения около тридцати раз, при этом статистические оценки обретают устойчивость. Хотя сама «устойчивость» понимается полуинтуитивно.
Я видел только одну книгу по метрологии (и то это была не книга, а пособие по лабораторным работам), где была ясно сказана известная каждому практически работающему инженеру и физику вещь — большинство измерений делается один раз.
Это легко понять, даже если вы в жизни не держали в руках тестера: подавляющее большинство измерений в современной технике — это автоматический контроль процессов, измерения онлайн. А они все однократны.
При наличии серии измерений (одной и той же величины — мы почему-то считаем, что она не изменяется) можно произвести обработку полученных данных и получить оценку параметров реального распределения, в частности, истинного (действительного) значения измеряемой величины. Выражаясь метрологично, желательно, чтобы оценка (то есть от способ ее получения) была «состоятельна», «несмещенна» и «эффективна».
Состоятельность оценки означает, что при увеличении числа опытов она приближается к истинному значению. Например, если распределение результатов измерений нормально и максимум совпадает с истинным значением, то среднее значение неограниченно приближается к истинному по мере увеличения количества измерений. Оценка не будет состоятельна, если распределение несимметрично, например близко к нормальному, но с ограничением с одной стороны (например, нулем — недвижимости по ценам). Впрочем, это распределение не только не нормально, но и даже ненормально.
В принципе возможно симметричное распределение, при котором средняя величина не приближается к истинному значению, хотя такое распределение не имеет ничего общего с нормальным и вряд ли может встретиться на практике. Заметим, что при симметричном бимодальном распределении оценка средним состоятельна. При нормальном распределении состоятельна также и оценка дисперсии.
Несмещенность означает отсутствие систематических отклонений оценки от параметра при любом конечном, в том числе и малом, объеме выборки. Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам, поскольку реальная выборка всегда конечна. При нормальном распределении оценка истинного значения средним является несмещенным, а оценка дисперсии по обычной формуле (сумма квадратов отклонений от среднего, деленная на число измерений) нет: при одном измерении она дает очевидную глупость — ноль. Поэтому формула корректируется, деление на число измерений заменяется на деление на число измерений минус один.
Эффективность оценки означает, что если извлекать из генеральной совокупности разные серии наблюдений, то полученные из них оценки какого-то параметра будут иметь минимальную дисперсию по сравнению с другими методами оценки.
В обычной ситуации часто имеет место распределение, близкое к нормальному. Иногда рассматривают другие распределения — равномерное, арксинусное, треугольное и другие, которые разумно сочетают соответствие реальности и удобство вычислений. Отклонения от нормального распределения, хоть большие, хоть вовсе неунимодальность, воспринимаются физиком как «Пионерская зорька» — то есть как указание на действие какого-то механизма, который можно попытаться определить. В частности неунимодальность может быть следствием неустойчивости, а может быть результатом смешения двух распределений.
Функция распределения определяется тем точнее, чем большим количеством измерений мы располагаем. Но чем больше измерений — тем дороже процедура и вообще, длительные измерения это не очень хорошо — сам объект может измениться (хотя растет шанс это заметить!), да и потребность в результате обычно связана с временем получения оного. Поэтому «все прогрессивное человечество» день и ночь размышляет, как по небольшому количеству измерений определить функцию распределения. Существует несколько способов оценить, удовлетворяет ли полученный набор данных той или иной функции распределения, есть несколько так называемых «критериев согласия»: хи-квадрат (Пирсона), Колмогорова, моментов. Само наличие нескольких критериев согласия говорит о гуманитарности всех таких оценок. Практическое же применение в значительной степени опирается на опыт, практику в конкретной области, «чутье».