59.66 € 66.68

Анатомия больших данных в транспорте

Анатомия больших данных в транспорте

Ведущий Data Architect компании Tesla Олексей Ильяшов верно отметил, что «умный» город — не то место, где много гаджетов, а то, где люди не тратят своё время бездарно. С этим утверждением трудно поспорить. Согласно отчету «GovLoop», ежегодные государственные потери в США, вызванные одними только пробками, составляют $121 млрд. Отрасль автомобильных грузоперевозок – это история как раз про управление ресурсом времени, а затем уже про то, чтобы доставить груз из одной точки в другую.

«Умным» город делают не только инфраструктурные, но и аналитические проекты. Более того – таким город становится в результате создания проектов, востребованность которых появляется как раз в результате исследования огромных массивов с виду разрозненных данных. Иными словами, именно большие данные являются драйвером всех мегапроектов в транспорте – будь это внедрение беспилотных автомобилей или глобальная аналитика дорожного движения.

Как добывать большие данные в транспорте, как управлять ими и оптимизировать инструменты для этой «добычи»? Сегодня мы разберемся в этом вместе с вами.

Ограничения и проблемы роста

Большие данные в отрасли логистики и грузоперевозок становятся особенно востребованными в эпоху перевода транспортных систем на ИТ-платформы. Очевидно, что для точного анализа ситуации существующих метрических систем изучения и мониторинга транспортных средств уже не хватает.

В качестве примера рассмотрим нишу видеофиксации дорожной ситуации. Камеры фиксации видеонарушений – один из ключевых источников больших данных на сегодняшний момент. Но они могут предоставлять лишь ограниченное количество информации.

Проблема в том, что существующие регламенты видеофиксации нарушений имеют ограниченный перечень ситуаций, подпадающих под определение соответствующих ситуаций. На деле же сценариев поведения транспортных средств на дороге, особенно в перспективе появления на трассах первых беспилотников, куда больше, чем заложено в электронные мозги камер. На данный момент это создает большую погрешность при использовании данных. В Нидерландах, например, ежегодно фиксируется около 1,5 млн. ДТП, но полицией учитывается не более 300 тысяч из этого объема. Остальные же ситуации не фиксируются, поскольку эти инциденты не подпадают под определения, зафиксированные в соответствующих регламентах.

Куда более интересно обстоят дела в Китае. Пограничный пункт между Китаем и Вьетнамом оборудован целым комплексом систем безопасности на основе мониторинга массива данных. Система распознавания в автоматическом режиме считывает номерной знак и лицо водителя, за 10 секунд до подъезда автомобиля к шлагбауму анализирует данные на предмет преступлений водителя, его долгов и др. метрик и принимает решение — закрыть шлагбаум или нет.

Наиболее точную аналитику по большим данным удается получить, когда первичный сборщик информации находится непосредственно в транспортном средстве. Так, объем ежедневной телеметрии, поступающей с каждой проданной Tesla в их аналитический центр во Фримонте — 40 МБ. Это 8 терабайт каждый день, которые обрабатываются в реальном времени. Это не только состояние машины, но и обмен данными между машиной и приложением на телефонах владельцев.

Примеры говорят о том, что современная экосистема больших данных должна предоставлять всем пользователям, как частным, так и корпоративным, возможность гибко влиять на все параметры, оптимизировать их с целью получения дополнительного экономического эффекта. Иначе аналитические потери при использовании соответствующего ПО будут слишком велики.

Какие большие данные можно собирать в транспортной отрасли

На сегодняшний момент можно разделить транспортные большие данные на два класса – по форме их сбора, что решительным образом влияет на формат получаемой информации.

Первый класс больших данных – статический. Информация в этом случае фиксируется, обрабатывается и передается дальше для обработки и интерпретации со стороны статичных, недвижимых датчиков. Это в первую очередь все виды камер – как установленных заранее, так и переносных мобильных, которые фиксируют лишь то, что попадает в их направленный фокус. Информация данного класса предельно локальна. Ее смысл и потенциал проявляются только когда собирается в длинную цепь.

Так, правоохранительные органы активно используют данные с камер, установленных на дорогах, для отслеживания траектории разыскиваемых автомобилей. Но этот анализ возможен только при совмещении данных, полученных одновременно с определенного количества камер. Искомый автомобиль должен попадать в несколько камер, чтобы можно было проложить точную траекторию или даже прогнозировать ее дальнейшее развитие. Но данные с одной отдельно взятой камеры не смогут сказать аналитикам чего-то принципиально важного.

Гораздо более широкие возможности предлагают большие данные второго класса – динамические. Это данные, получаемые с различных датчиков и устройств, которые не привязаны к конкретному месту и постоянно находятся в движении, часто – в непосредственной близости или даже внутри самого исследуемого объекта (можно сказать, что это классические датчики интернета вещей, вспомним пример с Tesla из Фримонта). Преимущество здесь – во фрактальности данных, в их самодостаточности. Один отдельно взятый поток информации может дать об исследуемом объекте достаточно информации для формирования различных гипотез. Наличие цепи устройств непринципиальна для работы. Главным игроком данного класса больших данных, как это ни банально звучит, является мобильное устройство – телефон или планшет, которые водитель возит с собой в легковом или грузовом автомобиле.

Транспортные компании работают прежде всего с динамическими данными. На основании лишь одного датчика GPS-ГЛОНАСС сегодня можно выявлять и анализировать следующие параметры, важные для отрасли и ее игроков:

  • загруженность дорог (анализ пробок, причин и тенденций возникновения заторов);

  • типовые траектории объезда пробок в отдельно взятых секторах города, выявление новых аварийных участков, плохо регулируемых перекрестков;

  • выявление на основе типовых траекторий объезда проблемных ситуаций с самой инфраструктурой города. Например, сопоставив данные по 2 – 3 тысячам треков маршрутов, пройденных фурами по одному и тому же проспекту в течение месяца, можно выявить не только наиболее эффективные и быстрые пути объезда заторов, чтобы затем предлагать данные объезды на уровне навигаторов в автомобилях, но и проблемы с дорожным полотном. Если при пустой дороге на объездном маршруте водитель, судя по треку, предпочитает выбрать другой, пусть и более загруженный проезд, это должно стать отправной точкой для формирования и проверки гипотезы: возможно, на этой пустой улице, которую все равно объезжает машина, слишком широко паркуются другие автомобили или слишком глубокие ямы, в которые лучше не попадать даже на малых скоростях, чтобы не сломать подвеску;

  • сезонность, зависимость объема заказов транспортной компании от: урожайности, хорошей погоды, качества дорог в тех или иных населенных пунктах;

  • техническое состояние агрегатов, расходных частей в транспортных средствах. Германское общество по международному сотрудничеству (GIZ) представило прогноз, по которому многие производители транспортных расходников, как, например, шины и компания Michelin, в ближайшем будущем будут продавать не продукцию, а большие данные о фактическом пробеге транспортных средств на основе сигналов, подаваемых датчиками в самих шинах. Датчик дает сигнал в технический центр об износе и необходимости скорой замены шины, а там сразу же формируется так называемый смарт-контракт на предстоящие работы по замене шины и ее закупку. Именно по такой модели сегодня продаются шины для самолетов.

При анализе всех этих параметров важно учитывать скорость реакции. В городе плотность потока больше, а длина участков меньше. В итоге требуется большая оперативность реагирования на те или иные события. Да и одной лишь скоростью управление движением не исчерпывается: есть и светофоры, и переход к одностороннему движению, а то и полностью закрытые участки для определенных видов транспорта. Так что система, рассчитанная на использование в городе, будет заметно сложнее. Сегодня Росавтодор и ряд других государственных и частных компаний ведут разработку приложений, позволяющих водителям в один клик отправлять компаниям, управляющим дорогами, данные о новых ямах на участках. Подобные мини-сервисы – основа для улучшения качества всей отраслевой инфраструктуры.

Что улучшает big data на транспорте

Наша страна имеет относительно невысокую протяженность дорожной сети – порядка 1,4 млн. км, в сравнении с ЕС и США (5,3 и 6,6 соответственно), это существенно обостряет проблему перегруженности дорог в ряде российских регионов. На большие данные возложена масштабная задача по оптимизации всех элементов дорожной инфраструктуры – от состояния дорог до эффективности работы светофоров и переходов.

Какие проблемы можно решать с помощью обработки больших данных:

  • геолокационная аналитика (гибкий анализ и проверка широкого спектра гипотез по развитию отдельных территорий с точки зрения логистической доступности, охвата транспортной сетью);

  • оптимизация цепей поставок (снижение холостого пробега для грузовиков, выявление дополнительных окон в маршрутах для попутной загрузки частично заполненных фур);

  • предупреждение обслуживание оборудования (анализ износа);

  • борьба с мошенничеством (блокировка возможности водителям приписывать время в рейсах);

  • сбор данных для оптимизации тарифов страховых компаний (весь застрахованный транспорт можно контролировать с точки зрения того, как аккуратно передвигается каждая фура, исходя из этого предоставлять дополнительные гибкие скидки перевозчикам).

Как добывать большие данные в транспорте

Согласно докладу Allied Market Research рынок LBS-услуг (сервисов на базе геолокации) вырастет к 2022 году до $61,897 млн с $11,994 млн в 2015 (ежегодный рост в 26,6%). И если в 2015 году фаворитами по выручке на рынке были картографические и навигационные приложения, то, по прогнозам аналитиков, далее рынок будет развиваться за счет внедрения инновационных технологий и услуг, на базе которых будут создаваться новые бизнес-модели. Речь идет в том числе про рынок сбора больших данных в логистике и транспортном страховании.

Аналитики, работающие с большими данными, извлекают знания из накопленных клиентами массивов информации, позволяя выявлять ранее не обнаруженный потенциал с пользой для бизнеса. По некоторым оценкам, в 2016 году рынок больших данных превысил $50 млрд. Некоторые сервисы обработки данных работают по модели big data as a service (BDaaS), позволяют загрузить данные в облако и получить результат после анализа получившейся базы данных с помощью алгоритмов. По похожей модели работает аналитическая платформа UPS Orion у одноименной транспортной компании.

ГЛОНАСС как инструмент добычи больших данных

Сегодня мы наблюдаем серьезное принуждение к ГЛОНАСС со стороны государства. Это связано с тем, что именно на эту систему придется основная нагрузка в период запуска первых беспилотных легковых и грузовых автомобилей в России. ГЛОНАСС станет основной для мониторинга и управления беспилотникам и будет помогать им в позиционировании, в небольших маневрах на малых скоростях, и давать высокоточные задания: например, точно припарковаться на выгрузку у крана или осуществить дистанционную заправку. Обычными тахографами такие задачи не решить. К тому же, если вся компонентная база в итоге будет подведена под общий отечественный знаменатель (чего и добивается в конечном итоге Минпромторг), то будут минимизированы проблемы, связанные с совместимостью между собой всех телеметрических устройств, которые в единой связке буду отвечать за тотальный контроль за действиями беспилотников на дорога общего пользования, флагманом этого комплекса должен стать именно спутник. ГЛОНАСС – важный источник больших данных для транспорта.

Еще в 2013 году PwC оценивал потерю экономической выгоды коммерческих организаций одной только Австралии от недостаточного использования больших данных в 33,5 млрд евро.

Частный водитель имеет право отказаться ставить на свой грузовик тахограф или другой GPS-маяк, а контролировать перевозку все равно нужно. Но водитель не может уехать в рейс без мало-мальски современного смартфона или планшета, на котором он включает геолокацию, чтобы посмотреть пробки. Это и есть та соломинка, за которую должен ухватиться рынок. Именно ПО, которое может удаленно контролировать водителей, стабилизирует отрасль в непростой переходный период. Главная революция произойдет не в двигателе фуры, а в ее кабине. Мобильное устройство станет точкой сборки важнейших данных и помогать в предотвращении самых разных кризисных ситуаций.

В предстоящие 2 – 3 года проникновение технологий «connectivity» на российский автомобильный рынок может составить 70 – 80%. Это ускорит и сбор больших данных. Основными драйверами роста являются крупные инфраструктурные проекты: Платон, ЭРА-ГЛОНАСС, Безопасный город, Система 112, Система экстренного реагирования при авариях «ЭРА-ГЛОНАСС», система весогабаритного контроля.

Вопросы безопасности

Большие данные в разрозненном виде малоинформативны, но в руках человека, который знает, что искать, они превращаются в сведения, чувствительные к частной жизни граждан. Вопрос сложно регулировать на уровне одного лишь ФЗ-152. В сфере логистики обязательно должны быть разработаны собственные лицензии по обеспечению безопасности транспортного ПО. Эти документы на уровне лицензий ФСТЭК должны обязывать каждого разработчика создавать обязательные уровни защиты для своего транспортного ПО. Ни одно ПО на рынке технологически не может существовать как «вещь в себе» и не допускать в свой периметр безопасности сторонние универсальные решения. Если с точки зрения эффективности сбора больших данных мобильное приложение выигрывает у аппаратных телеметрических комплексов, то в контексте безопасности оно, наоборот, пока проигрывает. Слабое звено – тот самый GPS-передатчик и сам мобильный телефон водителя с мобильной версией транспортного ПО. Если водитель получает заказы на перевозки у двух и более компаний и использует для их выполнения разные мобильные клиенты транспортного ПО, то хакеры, удаленно взломав мобильный телефон водителя, сразу же получают доступ к его аккаунтам во всех логистических системах. Это каскадная зависимость технологий и устройств, и важно не допустить цепной реакции в случае хакерской атаки.


Автор: Артур Мурадян, исполнительный директор транспортной ИТ-компании Traft

Подписаться на новости

Назад

Комментарии

Текст сообщения*
Защита от автоматических сообщений