САПР перешагнет через искусственный интеллект
В рамках прошедшего в Москве Autodesk University Russia 2015 Анатолий Левенчук, президент TechInvestLab и директор по исследованиям русского отделения INCOSE, рассказал о том, какое будущее ждет САПР и что нового он узнал, изучив последние разработки Autodesk.
Дмитрий Красковский: Анатолий, расскажите немного о себе. Вы правда занимаете две должности?
Анатолий Левенчук: Как у любого человека, у меня их много. Я президент «ТехИнвестЛаб», занимаю пост директора по исследованиям Русского отделения Международного совета по системной инженерии, являюсь членом исполкома Русского отделения SEMAT и т.д.
Анатолий Левенчук, президент TechInvestLab и директор по исследованиям русского отделения INCOSE
Д.К.: Русское отделение INCOSE — что это такое?
А.Л.: В мире примерно десять тысяч профессиональных системных инженеров, которые объединены в большую организацию. Это Международный совет по системной инженерии, International Council on Systems Engineering. В России есть русское отделение, где люди собираются, обсуждают системную инженерию.
Д.К.: А в каких отраслях?
А.Л.: Системная инженерия как раз отличается тем, что она позволяет создать любое изделие, начиная от коробки спичек и заканчивая, например, ракетой, которая летит на Марс. Обычно системная инженерия — это инженерия требований, инженерия системной архитектуры, инженерия испытаний. Системный инженер — это тот человек, который отвечает за систему в целом. Просто у нас в России такой традиции не существует. У нас нет системных инженеров, у нас, по большому счету, или инженеры по специальности, или ГИПы по факту превращаются в проектных менеджеров.
Д.К.: А кто такие системные архитекторы?
А.Л.: Это те люди, которые занимаются архитектурой системы, то есть описанием важнейших проектных или конструкторских решений системы. В России специалистов, которые в общем виде знают предметы инженерии требований и инженерии системной архитектуры, которые работают с разными практиками инженерии требований, инженерией системной архитектуры, просто нет. У нас в «реальном секторе» немного другая культура, хотя в информационных технологиях таких людей можно встретить и в России.
Д.К.: Вернемся к самому интересному — к вашему докладу. Вы сказали, что в ближайшем будущем появится голосовой интерфейс.
А.Л.: Ну, это не самый важный тезис в моем докладе. Потому что, как вы понимаете, голосовой интерфейс к телефонам уже есть довольно давно. То, что он будет использован для САПР, — незначительная новость.
Д.К.: Как это можно применить к САПР?
А.Л.: Рассмотрим такой пример: вам нужно провести линию. Вы указываете на экране точки и говорите: «Провести линию отсюда досюда». Всё. Экономит кучу времени. Двумя пальцами держите правильные места на экране и вслух проговариваете, например: «Длиной 14». САПР ехидным голосом переспрашивает: «14 чего? Попугаев?» Есть исследования, которые говорят, что у таких интерфейсов должна быть личность, должен быть не самый покладистый характер. Люди больше доверяют такому интерфейсу, им больше нравится работать с такими программами, чем с безэмоциональными безответными инструментами. Я думаю, что так оно и будет.
Но смею вас заверить, почемуто всех людей удивляет, что — ах, САПР еще и разговаривает? А то, что САПР вдруг проложит самостоятельно линию, поймет не только ее местоположение, но и тип, согласует всё с требованиями, а если гдето нарушается стандарт, то вам об этом расскажет — вот эта умная часть работы не удивляет, почемуто меркнет по сравнению с тем, что САПР разговаривает человеческим голосом. Сейчас любой навигатор разговаривает: «Через 20 метров поворот». Это уже никого не должно удивлять.
Д.К.: Поговорим о «болезни» разработчиков ПО — «айпадомании» и облачных технологиях.
А.Л.: Почему болезнь? Тут я с вами не согласен. Вот вы ее называете болезнью, а я говорю, что есть мода, а есть поветрие. Поясню. Поветрие — это то, что в какойто момент пришло, этим быстро переболели, и потом оно исчезло. А если мода на чтото, то это на какойто период становится остромодным, об этом все говорят, все это приобретают и используют, а потом к этому все привыкают, но используют только те, кому оно действительно нужно или просто нравится. Когдато миниюбки были остромодны, а потом стали немодными, но их все равно носят и будут носить те, кому они нравятся. Это уже быт. С планшетами и облаками тоже так же: острая мода на них пройдет, а они останутся, будут повсеместны.
Д.К.: В вашем докладе было сказано: «САПР будут собираться в PLM без дополнительного программирования интерфейсов и настройки структур данных». Поясните, что вы имели в виду?
А.Л.: Для этого надо оглянуться немного назад. Раньше у нас отдельно была PDM (Product data management), в которой были только данные о продукте. Потом появились и данные о проекте (project), то есть графики, сметы и т.д., вплоть до структуры организации и функционала управления изменениями (issue tracker). Это и означает PLM, которая была очень хорошо интегрирована, причем всегда со своим САПР.
А потом многие вендоры заметили, что все получается очень плохо, потому что много разных хороших САПР, и вендорам приходится включать эти САПР в состав своей линейки продуктов. Но каждый раз интегрировать структуру данных очередной покупаемой разработки САПР в собственную PLM становится все сложнее и сложнее.
После этого, примерно в середине 1990х, появились наработки в области структуры данных самих PLMсистем. Разработчики моделей данных для инженерных информационных систем пришли к очень интересному выводу о том, что структура данных в PLM должна на самом верхнем уровне описывать общую модель мира, содержать в себе понятия о времени и пространстве детали. Эти работы привели к созданию стандарта ISO 15926, и на этих идеях были основаны модели данных практически всех современных систем PDM/PLM.
И тут выяснилось, что идеи стандарта ISO 15926 воплощены практически во всех PLM, но вендоров, заинтересованных в массовой реализации самого стандарта, нет. Так что поставщики всех CAD/PLMсистем просто заявили, что они «совместимы со стандартом ISO 15926», хотя по факту никакой совместимости там нет, только «идеологическое соответствие».
Что происходит с реализацией ISO 15926 на самом деле — никто никогда не знает, потому что никто из клиентов не спрашивает.
То есть вы действительно можете различные PLM стыковать с различными САПР и свободно передавать данные, хотя это и очень трудоемко. Пока все PLM следуют общей архитектуре данных, но только немногие реально выполняют требования ISO 15926, а большинство предпочитают свои собственные обменные форматы. Это трудный путь, поскольку разнообразие передаваемых данных увеличивается с каждым годом.
Д.К.: И как скоро вендоры придут к согласию?
А.Л.: Вопрос сложный, поэтому сегодня мы имеем две полярные позиции. Первая, абсолютно теоретическая, инженерная, связанная с computer science, с онтологическим моделированием данных в нейтральном семантическом (даже не объекториентированном!) стандарте, а вторая — это позиция протекционизма, защиты вендорами своей продуктовой линии, сохранения олигополии.
Д.К.: Теперь поговорим об искусственном интеллекте.
А.Л.: Да, и это самое интересное. Мой партнер Виктор Агроскин не раз меня поправлял: «Ты зря “искусственный” говоришь, потому что это слово сбивает с толку. Речь идет просто об интеллекте». То, что мы не знаем, как делать в компьютере, — это интеллект. То, что мы знаем, как делать, — это уже не интеллект и не воспринимается как чтото интеллектуальное. Скажем, интеллектуальна ли операция деления? Нет, тут не нужен интеллект, это любой ребенок в начальной школе делает с закрытыми глазами. А в Италии в средние века деление серьезно изучали в университетах. Умение делить было вершиной интеллекта. Вы когданибудь пробовали в римских числах делить?
Д.К.: Нет.
А.Л.: А вот попробуйте. Когдато за это докторскую степень давали!
А сейчас операция деления не считается интеллектуальной, потому что люди знают, как ее делать. И шахматы перестали быть игрой интеллектуальной: любой телефон теперь показывает уровень международного мастера! Предметная область проектирования/конструирования сейчас интеллектуальна потому, что компьютер еще не продемонстрировал тех умений, которыми владеет проектант/конструктор. Но по мере перемещения этих умений в САПР такой САПР перестанет считаться «интеллектуальным».
Д.К.: А как же элемент творчества при проектировании? Того же спичечного коробка. «Железо» не может придумать чтото новое! Любой САПР — это прежде всего инструмент.
А.Л.: Безусловно, потому что пока САПР — Система Автоматизации и ПРоверки.
Д.К.: Автоматизированного проектирования.
А.Л.: Ничего она не проектирует автоматизированно, потому что generative design (порождающее проектирование, когда компьютер сам чтото проектирует) в САПР толькотолько начинается. И это порождающее проектирование пока еще не особо интеллектуально, человеку нужно программировать в нем выдачу формы. Сначала работает программист, и только потом проектант. То есть вы ему говорите — разбейте криволинейную стену, например, на почти одинаковые элементы, на 1000 почти одинаковых штук — он вам это сам сделает. Или выведет контур крыла в соответствии с заданным уравнением. А вот чтото понастоящему креативное есть сейчас только в очень развитых лабораториях. Например, такие проекты есть у Autodesk.
Д.К.: Например?
А.Л.: Dreamcatcher — форма деталей в нем не редактируется человеком и не программируется специально, а порождается (генерируется) компьютером на основании выраженного человеком на естественном языке проектного намерения. А когда компьютером (или человеком) уже предложена конструкция, то дальше компьютер может модифицировать форму так, чтобы упростить производство, например снять лишний материал для удобства печати на 3Dпринтере. У Autodesk это технология Within. Конструктор или проектант перестает редактировать трехмерную модель, он только выражает намерение и задает ограничения, дальше компьютер думает сам, при необходимости переспрашивая и уточняя замысел.
Вы скептичны тут потому, что, наверное, не отслеживали то, что происходит последние три года в области глубокого обучения (Deep Learning — одно из современных направлений в разработке компьютерного интеллекта). Там с творчеством все нормально: там и тексты, и песни, и стихи уже сочиняются, и картины генерируются. Там много чего интересного. И даже мода генерируется, компьютер теперь имеет художественный вкус.
Д.К.: Это не САПР. Вернее, это не проектирование чеголибо. Это все, можно сказать, игрушки.
А.Л.: Конечно, игрушки, на первых шагах всегда игрушки. Только заметим, это ровно те игрушки, которые почемуто много десятков лет не удавалось сделать. Как цифровые фотоаппараты — вспомним, что первые из них выглядели для профессиональных фотографов игрушками. Ну, и где теперь неигрушечные пленочные модели? С интеллектуальными САПР будет то же самое.
Д.К.: А почему вы уверены, что получится сейчас?
А.Л.: Мне нравятся вопросы: «А почему вы уверены?» В ответах на такие вопросы можно подробней раскрыть свою позицию. Вопервых, речь не идет об одном какомто изобретении, одной какойто технологии. Нет, интеллектстек состоит из очень многих уровней, каждый из которых является вполне самостоятельной технологической платформой. В интеллектстеке есть уровень «железа», уровень языка вычислительного программирования, уровень вычислительных библиотек, уровень собственно алгоритмов обучения, уровень когнитивной архитектуры, прикладной уровень. Вот тут, на прикладном уровне, впервые можно говорить о САПР. САПР просто будет использовать многие технологии, которые появились в других местах.
Но вопрос остается: а почему с обучающими алгоритмами в этом интеллектстеке не получалось до сих пор? Основные алгоритмы глубокого обучения были открыты гдето в 1998 году. Но тогда не было возможности их опробовать, потому что не хватало мощности компьютерного «железа». И только несколько лет назад догадались использовать для глубокого обучения графические ускорители для компьютерных игр. Так что спасибо геймерам, они косвенно оплатили прогресс в машинном обучении и тем самым открыли дорогу к интеллектуальным САПР.
Ход с использованием GPU (графических процессоров) не для ускорения графических вычислений был нетривиален. Архитектура этих GPUсистем не очень подходила для тогдашних алгоритмов, не было такого уж существенного ускорения. Но этого хватило, чтобы побить все рекорды в области распознавания изображения, распознавания речи и всего, что связано с распознаванием.
А дальше был еще очень хитрый ход. Когда говорят о распознавании, то принижают достижения глубокого обучения. Говорят: «Ну что вам это распознавание дает? Это просто кодирование, из большого входного пространства вы получаете небольшое выходное. Ну, распознали небольшое число классов, и что дальше?» Но если вы понимаете, как вы кодируете, так же можете и декодировать. То есть из небольшого количества признаков, свойств, компактного абстрактного описания изображения вы можете породить полное изображение. В этот момент у вас уже начинается творчество, то есть вы можете «отжать» информацию из текущих проектов, получить компактное знание проектирования/конструирования, сделать в нем небольшие преобразования, в высокоуровневых терминах высказать намерение и декодировать это компактное представление в исходное — получить традиционную цифровую модель здания или изделия.
Все получилось в эти годы ровно потому, что хватило: первое — понимания, насколько большие объемы данных нужны для машинного обучения. А они нужны очень большие, и сейчас учатся работать с тем, чтобы эти объемы данных были маленькие, как при обучении человека. Прямо сейчас для обучения компьютера нужны миллионы образцов, и пока нет методов обучения на малых объемах данных. И второе — ровно по причине обработки этих миллионов образцов для обучения нужна большая вычислительная мощность, которая раньше была доступна только в суперкомпьютерах.
Я боюсь, что вы недооцениваете этого момента с доступностью суперкомпьютерных вычислений на каждом рабочем месте. В мире САПР хорошо отследили, когда персоналки стали так же мощны, как раньше рабочие станции, но прогресс ведь на этом не остановился! Когдато терафлоп (триллион операций с плавающей точкой в секунду) — это была запредельная вычислительная мощность. Примерно, как гигабайт, про который говорили, что такой памяти у компьютера не бывает, не то что оперативной, даже внешней. А теперь у нас внешняя память идет на терабайты даже в ноутбуках. То же самое произошло со скоростью.
Если у вас 200 миллионов взрослого очень научного населения какойто страны и оно делает на калькуляторе 14 вычислений в сутки, — то они за год сделают всего 1 терафлоп этих операций. А вот графическая карта Titan X фирмы NVIDIA делает 7 терафлоп. Это означает, что надо взять семь таких стран со всеми их операциями на калькуляторе 200 миллионов человек по 14 в день за целый год, — и все это Titan X сделает за одну секунду. Понятно теперь, что произошло с мощностью компьютерного «железа» за последние годы?
И в тот момент, когда догадались глубокое обучение вести на игровых видеокарточках (это примерно 2012 год), выяснилось, что, оказывается, с использованием этих игровых видеокарт можно решать задачи распознавания речи, распознавания изображений, анализа текста. Инновация пришла совершенно из неожиданного источника.
Подводя итог вышесказанному, можно утверждать, что мы живем сейчас в то время, когда ситуация с искусственным интеллектом кардинальным образом поменялась. Поменялся тип работы, поменялась парадигма. Компьютерный интеллект больше не программируют, его сейчас обучают. Интеллектуальные САПР не программируют, их обучают. В Autodesk Dreamcatcher язык проектировщика не был запрограммирован, этот язык САПР выучил!
Д.К.: Хорошо, давайте двигаться дальше и отойдем от этой темы.
А.Л.: Давайте. Но еще раз скажу — это коренная точка моего доклада. В это никто не верит, это пропускают мимо ушей. Например, все знают, что в любом смартфоне уже несколько лет есть распознавание голоса. И телефон вашу речь распознает каждые полгода все лучше и лучше. Сейчас вы уже невнятно можете говорить или в условиях уличного шума — телефон все равно распознает речь правильно. Еще и язык сам определяет, когда русский, а когда английский! И это происходит офлайн, внутри телефона, без обращения на серверы Гугла или Яндекса. То есть глубокое обучение снижает требования к компьютерному «железу». В вашем телефоне уже есть та технология, которая позволяет сделать интеллектуальный САПР. И в фирмах, занимающихся выпуском САПР, это понимают.
Д.К.: У меня осталась пара небольших вопросов.
А.Л: Ничего страшного, я всегда готов. Но я понимаю, что то, что я говорю, еще очень непривычно. И оно звучит так же шапкозакидательно, как на самом деле было буквально пару лет назад.
Д.К.: Побольше, наверное. Не пару.
А.Л.: Но пару лет назад еще не было того, о чем я говорил… Все, о чем я говорю, в массы пошло только в 2012 году, когда алгоритмы глубокого обучения неожиданно для всех победили на соревнованиях по распознаванию изображений. Когда эти алгоритмы применили к распознаванию речи, ошибка распознавания уменьшилась сразу на 30%! За последние 25 лет это первый такой скачок качества в распознавании чего бы то ни было.
Д.К.: В вашем докладе вы сказали, что в дальнейшем инженеры — специалисты узкой направленности будут все менее востребованы.
А.Л.: Да.
Д.К.: Но сейчас вся система образования построена и перестраивается на то, чтобы как раз готовить исключительно узких специалистов.
А.Л.: Увы, нет. Это раньше специалистов готовили пять лет, и еще жаловались, что пяти лет не хватает. А сейчас образование устроено подругому.
Из образования сейчас убирают фундаментальные знания под лозунгами проектности. Но замысел проектности инженерного образования в мирето был другой! Выполнение студентами проектов должно доводить знания фундаментальных инженерных дисциплин до практического навыка. Один лишь практический навык не делает из человека хорошего инженера. Но мой тезис, касающийся уменьшения потребности в узких специалистах, был не об особенностях образования. Просто чем уже инженерная специальность, тем проще автоматизировать ее в САПР. Самыми последними будут автоматизированы практики системной инженерии: инженерии требований, инженерии системной архитектуры, проведения проверки и приемки (верификация и валидация).
Д.К.: Ну и в заключение — ваши пожелания читателям журнала.
А.Л.: В самом начале своего доклада я сказал, что не всех извозчиков возьмут в таксисты. Когда появятся и внедрятся те технологии и программы, о которых я рассказывал, не всех извозчиков нынешних САПР возьмут в таксисты интеллектуальных САПРов ближайшего будущего. Это вопервых.
Ну, а вовторых, хочется пожелать, чтобы ваши читатели не ориентировались на горизонты планирования в три или четыре месяца. Нужно утруждать себя исследованиями и разработками на гораздо большие сроки. Как говорится, хорошую вещь импортозамещением не назовут, ее назовут экспорториентированной продукцией. И если ваши читатели хотят хорошей вещью заниматься, то им сейчас надо потратить время и хорошо проработать материалы моего доклада, начать свои исследования и разработки — для того чтобы быть готовыми к этим новшествам.
Д.К.: Спасибо за интересную беседу!