Экспериментальное статистическое исследование физико-химических показателей винодельческой продукции
А. В. ВОРОБЬЕВА, Н. А. КРАСНОВА, Ю. Г. КУЗНЕЦОВА, В. И. ТРЕТЯК
Московский государственный университет технологий и управления

С теории статистических решений известно, что для обоснованного выбора статистик, по которым можно проводить оптимальное (наиболее достоверное) сравнение как одномерных, так и многомерных данных, необходимо знать или оценивать законы их распределений [1].
В отечественной и мировой рутинной метрологической практике измерений концентраций различных веществ (МИ 1317-86. ГСИ, ГОСТ Р ИСО 5725-1-2002 ГОСТ Р ИСО 5725-6-2002) принято в качестве функции плотности распределения вероятностей погрешности измерений или ее составляющих использовать закон, близкий к нормальному усеченному, если имеются основания полагать, что реальная функция распределения одномодальна, приблизительно симметрична и отлична от нуля на конечном интервале значений [2], (Н. Н. Рерих, А. А. Тупиченков, В. Г. Цейтлин, 1987). В связи с этим представляет значительный интерес экспериментальное исследование реальных законов выборочных распределений вероятностей характерных инструментальных показателей виноградных вин.
Экспериментальное статистическое исследование вин проводил на примере образцов натуральных сухих вин, произведенных на ОАО «Солнечная долина», ООО «Каскад», ЗАО «Берд-Лавера», ООО «Новочеркасский производственный экспериментальный винзавод им. Я. И. Потапенко», ОАО «Новочеркасский винно-водочный завод», ОАО АПФ «Фанагория», ООО «Донская чаша», ОАО «Московский межреспубликанский винзавод», ЗАО «Мыс-хако», ООО «Мильстрим-Черноморские вина», ООО «Кубань-Вино», ООО «Развитие», ЗАО «Игристые вина», ОАО «Витис», АОЗТ «Левокумское», ОАО «Джемете», ООО «Крымский винзавод», ООО «Шахтинский винно-водочный завод, ЗАО «Детчинский винзавод», ООО «Самтрест», ОАО «Холдинг Вин». Информацию собирали методом анкетирования предприятий на основе предложенной таблицы показателей (табл. 1).
Для получения репрезентативной выборки показателей натуральных сухих вин образцы вин одного вида (красные или белые вина), но разных предприятий объединяли в один вариационный ряд.
Ниже приведены результаты исследования выборочных распределений вероятностей значений физико-химических показателей на примере сухих красных (Кс) и сухих белых (Бс) виноградных натуральных вин одной страны-производителя 2004-2006 гг.
Исследовали статистики ряда физико- химических показателей виноградных вин (объемная доля этилового спирта, %; массовая концентрация: сахаров, г/дм3; титруемых кислот, г/дм3; общей и свободной сернистой кислоты, мг/дм3; меди, мг/дм3; летучих кислот в пересчете на уксусную кислоту, г/дм3; железа, мг/дм3), определенных на газовом хроматографе по ГОСТ 7208-93.

Таблица 1


Рис. 1. Нормальный вероятностный график для значений показателя Х3 (Кс):
прямая линия — теоретическое нормальное распределение; точки — выборочное распределение
В качестве примера ниже приведен статистический анализ объемной доли этилового спирта, % (XJ; массовой концентрации общей (Х2) и свободной (Х3) сернистой кислоты, мг/дм3; массовой концентрации летучих кислот в пересчете на уксусную кислоту, г/дм3 (Х4).

Для анализа выборочных распределений вероятностей показателей вина использовали визуальные и численные методы (параметрические и непараметрические) [3]. Данные обрабатывали при помощи программы Statistica.
Для визуальной оценки сходства или различий выборочных распределений вероятностей исследуемых показателей с нормальным распределением были построены нормальные вероятностные графики и гистограммы значений показателей.


Рис. 2. Гистограмма распределения значений показателя Х2 красного сухого вина и график нормального распределения

Рис. 3. Гистограмма распределения значений показателя Х2 белого сухого вина и график нормального распределения

Бимодальность распределения значений физико-химического показателя Х2 может быть следствием использования сырья с разными характеристиками.
Количественные значения основных числовых характеристик вариации исследуемых показателей образцов сухих виноградных вин приведены в табл. 2. Нормальность распределения численными методами проверяли только при

На основании рассчитанных значений коэффициента вариации проводили дальнейшую численную проверку на нормальность выборочных распределений вероятностей физико-химических показателей Х1, Х2, Х4. виноградных вин с использованием параметрического критерия асимметрии и эксцесса и непараметрического — хи-квадрат (табл. 3).
В табл. 3 представлены: s — асимметрия или характеристика смещения распределения относительно математического ожидания (вправо — при положительном значении); е — эксцесс или характеристика остроконечности (при положительном значении) или пологости (при отрицательном значении) распределения по сравнению с нормальной кривой; σs и σе — стандартные отклонения коэффициентов асимметрии и эксцесса соответственно; р0 —  пороговый уровень вероятности или значимости гипотезы о соответствии выборочного распределения теоретическому нормальному распределению; %2 (хи-квадрат) — непараметрический критерий проверки гипотезы о нормальности распределения; f — число степеней свободы выборочного распределения; р — вероятность или уровень значимости гипотезы.

Нормальный вероятностный график — двумерный график, на вертикальной оси которого отложены упорядоченные по возрастанию наблюдаемые данные, а на горизонтальной оси — соответствующие Z-значения стандартного нормального распределения:

где— среднее значение; σ — стандартное отклонение.
При нормальном распределении наблюдаемых значений построенные точки попадают на диагональную прямую линию.
Нормальный вероятностный график для показателя Х3 (Кс) свидетельствует о значительном отличии выборочного распределения вероятностей показателя Х3 (красное сухое вино) от нормального, что и следовало ожидать из-за объединения в один вариационный ряд образцов сухих вин различных производителей (рис. 1).

Таблица 2

Таблица 3

О характере выборочного распределения вероятностей исследуемого показателя (например, Х2) можно судить по форме гистограммы, на которую наложена нормальная кривая с параметрами N (102,95; 23,58) для красного сухого вина (рис. 2), N (111,99; 14,26) (рис. 3) для белого сухого вина. Эти графики наглядно показывают значительные различия между выборочным эмпирическим распределением вероятностей физико-химического
показателя Х2 и нормальным распределением.
Критерии несмещенности оценок показателей асимметрии и эксцесса выражаются условиями (неравенствами) и , при выполнении которых величины асимметрии и эксцесса считаются несущественными (незначимыми), а их наличие объясняется воздействием случайных факторов.

 Критерий %2 (хи-квадрат) принимает маленькое значение, если р > р0.
На основании параметрического критерия асимметрии и эксцесса гипотеза нормальности распределения для выборочных распределений вероятностей показателей Х1, Х2 красных сухих вин и показателей Х1, Х2, Х4 белых сухих вин может быть принята.
Отклонения реальных выборочных распределений вероятностей показателей Х2, Х4 (красные сухие вина) от нормального на основании непараметрического критерия X2 (хи-квадрат) незначимы на стандартном уровне р0 = 0,05 (р > р0).
Условием нормальности выборочного распределения является одновременное выполнение как параметрических, так и непараметрического критериев. На основании данных табл. 2,3 можно сделать вывод, что вариация значений только физико-химического показателя Х2 для красного сухого вина описывается выборочным распределением вероятностей, которое по своей форме близко к нормальному распределению (различия незначимы на строгом уровне).
Остальные выборочные распределения вероятностей физико-химических показателей сухого виноградного вина отличаются от нормального.
Проведенное экспериментальное статистическое исследование выявило, что вариация значений различных физико-химических показателей виноградных вин описывается как одномодальными, так и бимодальными выборочными (эмпирическими) распределениями вероятностей конечной ширины. Некоторые одномодальные выборочные распределения вероятностей по своей форме близки к теоретическим нормальным распределениям. Однако в большинстве случаев одномодальные выборочные распределения вероятностей значений физико-химических показателей виноградных вин отличаются от теоретических нормальных распределений. Это также обосновывается и физическим смыслом задачи — реальные концентрации веществ строго положительны и заключены в конечных пределах.
Проведенный анализ обширного статистического материала позволяет предположить, что наиболее вероятными причинами многомодальности являются вариации как регламентов изготовления продукции, так и источников поставки сырья.

ЛИТЕРАТУРА

  1. Малиновский Л. Г. Анализ статистических связей: Модельно-конструктивный подход — М.: Наука, 2002.
  2. Калмановский В. И Продолжение легенды о прецизионности//Партнеры и конкуренты. 2003. № 12.
  3. Миттанг X., Ринне X. Статистические методы обеспечения качества/Пер. с нем.; под ред. Б.Н. Макарова. — М.: Машиностроение, 1995.