Синтетические данные: ключ к гуманным городским цифровым двойникам
Современные города стремятся стать «умными», и центральное место в этой концепции занимают цифровые двойники – детализированные 3D-модели городской среды. Созданные с помощью передовых технологий, таких как камеры и LiDAR, они превосходно отображают физическую структуру городов: здания, дороги, инженерные сети. Однако, сосредоточившись на «бетонной» составляющей, создатели этих моделей часто упускают из виду самый динамичный элемент – людей.
Именно поведение жителей – их передвижение, взаимодействие, повседневная жизнь – делает городскую среду живой. Игнорирование этого аспекта приводит к созданию неполноценной картины. Цифровой двойник может точно воссоздать инфраструктуру, но не показать, как люди пользуются парками, передвигаются по тротуарам или ищут нужный автобус. Такой подход ограничивает возможности для решения сложных городских проблем и обеспечения справедливого развития.
Решением становится расширение фокуса цифровых двойников за пределы физических объектов, включая реалистичное моделирование человеческого поведения. Несмотря на обилие данных о горожанах, их прямое использование сопряжено со значительными рисками конфиденциальности. Исследователи предлагают использовать синтетические данные – искусственно сгенерированную информацию, которая статистически имитирует реальные данные, – для создания более полных и гуманных цифровых двойников.
Баланс между конфиденциальностью и детализацией
Создание гуманного и инклюзивного цифрового двойника требует детального учета поведения людей, отражая всё многообразие населения: семьи с детьми, пожилых людей, жителей с ограниченными возможностями. Однако полагаться исключительно на реальные данные непрактично и этически сложно.
Основными препятствиями являются строгие законы о защите данных, такие как GDPR в Европейском Союзе, которые ограничивают доступ и обмен конфиденциальной информацией. Это затрудняет сравнение результатов исследований и получение ценных знаний из прошлых работ. Кроме того, реальные данные часто бывают необъективными. Неравномерный сбор информации может привести к недостаточному представлению определённых групп населения, например, жителей из малообеспеченных районов. Компьютерные модели, обученные на таких данных, могут усугубить существующее неравенство. Хотя статистические методы, такие как взвешивание данных, могут помочь компенсировать недопредставленность, синтетические данные предлагают более прямое решение.
Синтетические данные: инструмент для справедливых городов
Интеграция синтетических данных о поведении людей трансформирует цифровые двойники, превращая их из статичных моделей инфраструктуры в динамичные симуляции городской жизни. Моделируя перемещения пешеходов, использование общественного транспорта и активность в общественных пространствах, планировщики могут включить в модели более широкий спектр человеческих действий, делая их более инклюзивными.
Примером служит использование цифрового двойника для моделирования системы скоростного автобусного сообщения TransMilenio в Боготе, Колумбия. Вместо ограниченных или чувствительных к конфиденциальности данных с реальных датчиков, городские планировщики сгенерировали синтетические данные. Эти данные имитируют миллионы автобусных прибытий, скорости движения и длину очередей, основываясь на статистических закономерностях реальной эксплуатации системы, включая пиковые и непиковые часы.
Такой подход делает городское планирование более реалистичным и разнообразным. Например, синтетические данные о пешеходном движении позволяют моделировать, как пожилые люди и люди с ограниченными возможностями будут перемещаться по новому городскому дизайну. Это также позволяет проводить безрисковое тестирование идей. Планировщики могут симулировать различные синтетические популяции, чтобы оценить, как новый план эвакуации при наводнении повлияет на разные группы, не подвергая риску чью-либо безопасность или конфиденциальность в реальном мире.
Обеспечение доверия к цифровым двойникам
Для того чтобы синтетические данные были полезны, планировщики должны им доверять. Поскольку на основе этих виртуальных миров принимаются важные решения, синтетические данные должны стать надежной заменой реальным данным. Планировщики могут проверить это, сравнив политические решения, принятые с использованием синтетических данных, с теми, которые были бы приняты на основе реальных, но потенциально нарушающих конфиденциальность данных.
Помимо технических проверок, важно уделять внимание вопросам справедливости. Это включает регулярный аудит синтетических моделей на наличие скрытых предубеждений или недостаточной представленности различных групп. Например, можно убедиться, что план экстренной эвакуации в цифровом двойнике будет эффективен для пожилых жителей с ограниченной мобильностью.
Самое главное, планировщики должны вовлекать сообщества. Создание консультативных советов граждан и разработка синтетических данных и сценариев симуляции непосредственно с жителями города помогает гарантировать, что их опыт будет точно отражен.
Переходя от статической инфраструктуры к динамичным средам, включающим поведение людей, синтетические данные играют ключевую роль в будущем городского планирования, формируя устойчивые, инклюзивные и ориентированные на человека цифровые двойники.
Комментарии