По всем вопросам звоните:

+7 495 274-22-22

УДК: 311: 631: 004.67, ВАК 08.00.12 DOI:10.33920/sel-11-2012-04

Анализ результатов Всероссийской сельскохозяйственной переписи с использованием методов машинного обучения

Харитонова Анна Евгеньевна канд. экон. наук, доцент кафедры статистики и эконометрики, ФГБОУ ВО «РГАУ — МСХА им. К. А. Тимирязева» 127434, г. Москва, ул. Тимирязевская, д. 49 Е-mail: kharitonova.a.e@rgau-msha.ru
Сундупей Алина Алексеевна магистрант 124 группы института экономики и управления АПК, ФГБОУ ВО «РГАУ — МСХА им. К. А. Тимирязева» 127434, г. Москва, ул. Тимирязевская, д. 49 Е-mail: alisundupey@gmail.com
Скачкова Светлана Александровна д-р экон. наук, профессор кафедры экономики, ФГБОУ ВО «РГАУ — МСХА им. К. А. Тимирязева» 127434, г. Москва, ул. Тимирязевская, д. 49 Е-mail: svskachkova@mail.ru

В статье проведен сравнительный анализ итогов Всероссийской сельскохозяйственной переписи 2006 и 2016 гг. В результате отмечается сокращение числа сельхозтоваропроизводителей, снижение размеров сельскохозяйственных угодий и техники в организациях. На этом фоне виден рост концентрации производства как в растениеводстве, так и в животноводстве. Были построены модели машинного обучения для классификации организаций по получению субсидий с использованием библиотек Python. Точность построенных моделей составила до 86 %, что доказывает возможности их использования. В перспективе применение методов машинного обучения позволит сократить число показателей ВСХП и с высокой точностью классифицировать организации по качественным признакам.

Литература:

1. Итоги Всероссийской сельскохозяйственной переписи 2016 года: в 8 т. — М.: ИИЦ «Статистика России», 2018. — 383 с.

2. Введение в машинное обучение с помощью Python. А. Мюллер, С. Гвидо / пер. с англ. –Спб.: ООО «Диалектика», 2019. — 480 с.

3. Грас, Дж. Data Science. Наука о данных с нуля / пер. с англ. — Спб.: БХВ-Петербург, 2019. — 336 с.

4. Итоги Всероссийской сельскохозяйственной переписи 2006 года: в 9 т. — М.: Росстат, 2006.

5. Харитонова А.Е. Статистический анализ эколого-экономических систем сельского хозяйства (по данным ВСХП 2016 года) // Доклады ТСХА. Сборник статей. — 2018. — С. 100–103.

6. Харитонова А.Е. Статистический анализ состояния сельскохозяйственных угодий по данным сельскохозяйственной переписи // Статистика — язык цифровой цивилизации: сборник докладов II Открытого российского статистического конгресса: в 2 т. — 2018. — С. 620–625.

7. Зинченко, А.П. О программе Всероссийской сельскохозяйственной переписи 2016 года / А.П. Зинченко, А.В. Уколова // Вопросы статистики. — 2014. — № 2. — С. 10–16.

8. Романцева Ю.Н. Анализ технической обеспеченности сельскохозяйственных производителей в России // Экономика сельского хозяйства России. — 2019. — № 3. — С. — 19–24.

9. Баутин, В.М. Статистическая оценка ресурсного потенциала сельхозпроизводителей (по данным ВСХП-2006 и ВСХП-2016) / В.М. Баутин, А.В. Уколова, Ю.Н. Романцева // Бухучет в сельском хозяйстве. — 2017. — № 11. — С. 54–63. 10.Проблемы экономической и сельскохозяйственной статистики: монография / А.П. Зинченко, В.М. Баутин, А.Д. Думнов, Н.А. Эльдяева, А.В. Уколова, Ю.Н. Романцева, Е.С. Кованова, А.В. Тихонова, А.Е. Харитонова, Д.В. Дзюба, А.В. Сергеев. — Иркутск: Изд-во ООО «Мегапринт», 2017. — 161 с.

1. Itogi Vserossiyskoy sel’skokhozyaystvennoy perepisi 2016 goda: v 8 t. — M.: IITs «Statistika Rossii», 2018. — 383 s.

2. Vvedenie v mashinnoe obuchenie s pomoshch‘yu Python. A. Myuller. S.Gvido. Per. s angl. — Spb.: OOO «Dialektika», 2019. — 480 s.

3. Gras, Dzh. Data Science. Nauka o dannykh s nulya. Per. s angl. — Spb.: BKhV-Peterburg, 2019. — 336 s.

4. Itogi Vserossiyskoy sel’skokhozyaystvennoy perepisi 2006 goda: v 9 t. — Rosstat. M., 2006.

5. Kharitonova A.E. Statisticheskiy analiz ekologo-ekonomicheskikh sistem sel’skogo khozyaystva (po dannym VSKhP 2016 goda) // Doklady TSKhA: sbornik statey. — 2018. — S. 100–103.

6. Kharitonova A.E. Statisticheskiy analiz sostoyaniya sel’skokhozyaystvennykh ugodiy po dannym sel’skokhozyaystvennoy perepisi // Statistika — yazyk tsifrovoy tsivilizatsii: sbornik dokladov II Otkrytogo rossiyskogo statisticheskogo kongressa: v 2 t. — 2018. – S. 620–625.

7. Zinchenko, A.P. O programme Vserossiyskoy sel’skokhozyaystvennoy perepisi 2016 goda / A.P. Zinchenko, A.V. Ukolova // Voprosy statistiki. — 2014. — № 2. — S. 10–16.

8. Romantseva Yu.N. Analiz tekhnicheskoy obespechennosti sel’skokhozyaystvennykh proizvoditeley v Rossii // Ekonomika sel’skogo khozyaystva Rossii. — 2019. — № 3. — S. — 19–24.

9. Bautin, V.M. Statisticheskaya otsenka resursnogo potentsiala sel’khozproizvoditeley (po dannym VSKhP-2006 i VSKhP-2016) / V.M. Bautin, A.V. Ukolova, Yu.N. Romantseva // Bukhuchet v sel’skom khozyaystve. — 2017. — № 11. — S. 54–63. 10.Problemy ekonomicheskoy i sel’skokhozyaystvennoy statistiki: monografiya / A.P. Zinchenko, V.M. Bautin, A.D. Dumnov, N.A. El’dyaeva, A.V. Ukolova, Yu.N. Romantseva, E.S. Kovanova, A.V. Tikhonova, A.E. Kharitonova, D.V. Dzyuba, A.V. Sergeev. — Irkutsk: Izd-vo OOO «Megaprint», 2017. — 161 s.

Статья поступила 3 сентября 2020 г.

Итоги Всероссийской сельскохозяйственной переписи позволяют получать достоверную информацию о произошедших структурных сдвигах в сельском хозяйстве, об изменениях ресурсного потенциала, о роли каждой категории сельхозпроизводителей в производстве. Ряд показателей переписи невозможно получить из текущей статистики, что делает необходимым комплексный анализ ее итогов для получения достоверной информации об уровне сельскохозяйственного производства страны. Использование обезличенных первичных данных при этом дает возможность применять современные методы машинного обучения для возможности использования разработанных алгоритмов к новым организациям для предсказания их основных характеристик. Разработанная методика может в перспективе сократить число показателей ВСХП для снижения затрат на сбор данных.

Общая характеристика условий сельскохозяйственной деятельности была проанализирована по данным ВСХП 2006 и 2016 гг. по сельскохозяйственным организациям, так как на их долю приходится 83,5 % сельскохозяйственных угодий, 69,0 % всех посевных площадей страны и 44,5 % всего поголовья КРС [1].

Инструментами анализа послужили методы классификации, такие как наивный классификатор Байеса, алгоритм k-ближайших соседей, метод опорных векторов, логистическая регрессия и случайный лес.

Наивные байесовские классификаторы являются вероятностными классификаторами и исходят из теоремы Байеса, которая рассматривает функции как независимые. Байесовский классификатор оценивает параметры, рассматривая каждый признак отдельно, и по каждому признаку собирает простые статистики классов. Он присваивает метки классов наблюдениям, представленным векторами признаков. По сути, байесовский классификатор представляет собой вероятностную модель [2].

Метод k-ближайших соседей может рассматриваться как один из самых простых методов машинного обучения. Он относит объекты к классу, которому принадлежит большинство из k его ближайших соседей в многомерном пространстве признаков.

Для Цитирования:
Харитонова Анна Евгеньевна, Сундупей Алина Алексеевна, Скачкова Светлана Александровна, Анализ результатов Всероссийской сельскохозяйственной переписи с использованием методов машинного обучения. Бухучет в сельском хозяйстве. 2020;12.
Полная версия статьи доступна подписчикам журнала
Язык статьи:
Действия с выбранными: