Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Робин Ли
Top Business Awards
Baidu – китайская компания, предоставляющая веб-сервисы, основным из которых является одноименная поисковая система. Технологии Baidu способны переводить речь в режиме реального времени с одного языка на другой, распознавать степень правдивости найденной информации и даже найти похищенного человека. Из этой книги вы узнаете, какие технологии помогли Baidu обыграть Google и какие возможности в будущем откроет перед нами искусственный интеллект.
В формате PDF A4 сохранен издательский макет.
Робин Ли
Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google
Robin Lee
ARTIFICIAL INTELLIGENCE REVOLUTION
How AI Will Change our Society, Economy, and Culture
© Перевод на русский язык Падериной Ю., 2021
© Оформление. ООО «Издательство «Эксмо», 2021
Предисловие
Мир замер в предвкушении интеллектуальной революции. Что-то похожее я впервые почувствовал около 20 лет назад накануне интернет-бума в Кремниевой долине.
Это навеяло воспоминания о моем знакомстве с идеей искусственного разума. Начав с изучения процессов управления информацией в Китае, я отправился в Америку совершенствовать знания в сфере компьютерных технологий. Оборудование и техника никогда не вызывали у меня особенного интереса. А вот идея создания искусственного интеллекта, напротив. Я нашел время для посещения дополнительного курса, познакомился с ней поближе. И был поражен. Я не без основания подумал, что за искусственным интеллектом будущее.
Учился я довольно неплохо. Это позволило выкроить время для самостоятельных исследований. Оказалось, что искусственному разуму пока не подвластно решение реальных задач. Все испытания проходили с большим трудом и не давали значимых результатов. И, хотя на него возлагались большие надежды, время ИИ еще не пришло.
Но компьютерные технологии продолжали ускоренное развитие. И с их прогрессом давняя мечта получила надежду.
Пока я и мои коллеги в течение десятилетия занимались разработкой собственной поисковой системы, искусственный интеллект начал входить в нашу жизнь. Сегодня информационные технологии шагают вперед огромными шагами. Все, от аппаратного до программного обеспечения, постоянно совершенствуется. Кажется, у человечества наконец-то появилась возможность найти искусственному интеллекту реальное применение.
Мы сразу задали себе вопрос: как и почему ИИ может быть эффективен в современных условиях? Суммировали имеющиеся данные, провели более детальные подсчеты. И начали путь по возрождению идеи создания ИИ.
Появление глобальной сети интернет в свое время изменило структуру информации. А возникновение мобильного интернета перевернуло имеющиеся представления о распределении ресурсов. Человеческая жизнь оказалась полностью зашифрована в цифровых кодах. Ученые получили объемы информации для анализа, о которых не могли и мечтать. А вычислительные мощности стимулировали создание новых методов облачных вычислений. На этой почве появился метод «машинного обучения», который рекомендует пользователям интересные им товары и услуги, дает соответствующую их запросам рекламу. А также метод точного голосового ввода. Мы стоим на пороге новой технологической революции, которая по своим масштабам не будет уступать предыдущим.
Глобальные изменения в сфере компьютерных технологий спровоцировали к себе повышенный интерес со стороны многих деятелей науки и техники. Начались активные просчеты возможных рисков. В результате сложилось два противоположных мнения. Одна группа профессионалов опасается того, что если искусственный интеллект достигнет пика своего развития, человечество окажется во власти машин. Другая настроена более скептически: ИИ может застрять на низшей точке развития и сейчас это всего лишь очередной инновационный «мыльный пузырь».
Такой стремительный темп развития IT-технологий требует к себе повышенного внимания. Как сторонник высоких технологий, я полагаю, что человечеству не стоит переоценивать их краткосрочное влияние и недооценивать долгосрочное.
Принято выделять три этапа развития искусственного интеллекта: первый – слабый, второй – сильный, третий – суперинтеллект. Технологии первого этапа лежат в пределах наших возможностей и могут быть созданы руками человека. Сторонники идеи искусственного разума выражают опасения, что, достигнув третьего этапа развития, интеллект поработит человечество. А тогда…
Я же более скептически отношусь к данному вопросу. Даже самый продвинутый искусственный интеллект не сможет сделать такой грандиозный шаг вперед. Машины приблизятся к человеческим возможностям, однако никогда их не превзойдут.
Но только лишь намек на близость – опасная грань. Уже сейчас компьютер во многих отношениях превосходит человека. Например, в способности запоминать информацию. Поисковая система Baidu запоминает каждое слово на сотнях миллионов страниц, что неподвластно ни одному человеку. Или еще пример. Если вы попросите у системы написать за вас стихотворение, зададите тему и нажмете клавишу «ВВОД», через секунду оно будет у вас перед глазами. Даже гении не отличаются подобной скоростью.
Единственное, в чем искусственный интеллект нас догнать не сможет – эмоции, чувства и способность к творчеству.
Интеллектуальная революция отличается от всего предыдущего отношениями между людьми и технологиями. Во время первых трех революций – электрической, технологической, информационной – люди создавали новый мир своими руками благодаря развитию научной мысли. Интеллектуальная стала возможна только благодаря симбиозу человека и машины. Первые три эпохи технологического развития – это люди, которые учатся создавать машины, боятся их, но вынуждены приспосабливаться. Революция ИИ – это машины, которые адаптируются под человечество и заинтересованы удовлетворять его потребности.
Сегодня люди и машины наконец-то нашли общий язык. Больше не нужно учиться пользоваться машинами, например телевизором или системой очистки воздуха. Достаточно всего лишь дать им команду, и они поймут тебя. Искусственный интеллект упростит, а не усложнит человеческую жизнь. В перспективе улучшит коэффициент человеческой производительности, что приведет к прогрессивному обществу.
6-7 лет назад никто не строил оптимистичных планов и не думал вкладывать внушительные средства в новое направление развития компьютерных технологий. Но уже тогда появилась первая искра, осветившая новую эпоху искусственного интеллекта.
Пока ученые из своих университетов и лабораторий твердят о начале новой эры ИИ и ее стремительном развитии, международные корпорации, такие как Google, Microsoft или Amazon, продолжают накапливать невообразимое количество данных для последующей коммерциализации. Ведущая роль бизнеса в этой технологической революции становится все очевиднее.
Летом 2016 мне довелось провести несколько недель в Кремниевой долине. Однажды во время обеда с несколькими учеными из Стэндфордского университета тема разговора коснулась ИИ. Один из моих друзей-профессоров сказал: «В научном мире многие не заинтересованы в углубленном изучении темы искусственного интеллекта. Основные денежные средства вливаются в развитие промышленности. А какие бюджеты требуются на исследования ИИ, мы даже и представить себе не можем». Он предложил коллегам угадать бюджет, вложенный в разработку Baidu. После того, как были высказаны все предположения, в разговор вступил я. Ответил, что не могу озвучить точную сумму. Мы вложим столько, сколько потребуется.
Вследствие недостатка финансирования исследований у ученых в лабораториях нет необходимого оборудования, чтобы успешно справляться с обработкой имеющихся данных и продолжать разработку искусственного интеллекта. Поэтому многие покидают свои кабинеты и перебираются в масштабные корпорации, которые находятся в самом центре глобальной сети Интернет. Оборудование Google или Baidu позволяет ежедневно справляться с огромным потоком информации поисковых запросов, местоположений и т. п.
Мы создаем интеллект Baidu и надеемся, что таким образом даем платформу для развития множеству талантливых исследователей. Китай и США некоторое время руководствовались разными подходами по привлечению специалистов: Америка не очень лояльно относилась к эмигрантам, Китай же все шире открывал двери для талантливых людей со всего мира.
К счастью, многие выдающиеся и даже лучшие ученые в области развития искусственного интеллекта уже пришли работать в Baidu. Но ни один человек не сможет сделать что-то значимое с нуля. Здесь важна команда и инфраструктура. А также внимание к развитию корпоративной культуры. У вас никогда не будет эффективного сотрудничества с человеком, с которым вы знакомы только по слухам и домыслам. Как поисковая система Baidu использует имеющиеся у нее данные для создания привлекательности товара или услуги для потенциального клиента, так и я предпочитаю общаться со своими сотрудниками, чтобы лучше понять их и найти общий язык. Правда, я всегда немного переживаю во время знакомства. Зачастую зря. Потому как с хорошими людьми контакт налаживается сразу.
Конечно, интеллектуальная революция немыслима без поддержки правительства. В марте 2015 года на Боаоском Азиатском форуме мы с Биллом Гейтсом, Иланом Маском и другими американскими инновационными предпринимателями обсуждали тему ИИ как в формальной, так и не формальной обстановке. Мы достигли консенсуса во многих аспектах. Один из них заключается в том, что поддержка правительства очень важна для инновационной отрасли.
Объективно говоря, Китай на сегодняшний день является центром технологического развития искусственного интеллекта, а основная концентрация талантов находится в США. Но Китай имеет и другие преимущества. Например, население в 1,3 миллиарда человек и около 700 миллионов пользователей интернета. С точки зрения единого рынка данный показатель является самым высоким в мире. Огромную роль в развитии информационных технологий также играет правительство, у которого есть возможность унифицировать огромные объемы информации. На двух национальных сессиях перед Боаоским Азиатским форумом я представлял проект под названием «План развития китайского интеллекта» в надежде собрать недостающие ресурсы для развития ИИ и сферы общественных услуг на национальном уровне. Это станет серьезным шагом в сторону интеллектуальной революции и поможет ускорить процессы технических и экономических преобразований в стране.
Стоит отметить, что развитые страны, такие как США и страны Европы, вывели разработку искусственного интеллекта на национальный стратегический уровень. В 2016 году помимо трех докладов, опубликованных Правительством США, в свет вышел стратегический план исследований и разработок в области IT-технологий. Речь в нем шла о необходимости развития ИИ для повышения конкурентоспособности предприятий, о возможности государственного управления и интеграции с национальной мощью. Таким образом, на международном уровне наблюдается все возрастающая конкуренция в погоне за искусственным интеллектом. В этой сфере правительство Китая сейчас бессильно.
В марте 2015 года премьер-министр Ли Кэ Цзян в докладе о работе Правительства упомянул о концепции «Интернет +». Четыре месяца спустя Государственный Совет опубликовал «Руководство Государственного Совета по активному продвижению концепции “Интернет +”», где впервые был упомянут искусственный интеллект. А в мае 2016 Руководство трансформировалось в трехлетний «План реализации концепции “Интернет +”». Он стал официальной платформой для развития искусственного интеллекта в стране.
В марте 2017 года корпорация Baidu получила официальное разрешение Национальной комиссии по развитию и реформам на объединение нескольких научно-исследовательских институтов в «Национальную инженерную лабораторию глубокого обучения». Это первая и единственная подобная лаборатория в Китае. Она сосредоточена на 7 основных направлениях: технология глубокого обучения, технология компьютерного зрения, технология распознавания звука, технология биометрической идентификации, технология взаимодействия человека и компьютера, стандартизированные услуги, права на интеллектуальную собственность глубокого обучения. Таким образом мы стремимся решить проблему недостаточной поддержки развития ИИ в Китае и повысить международную конкурентоспособность национальной интеллектуальной промышленности.
Это можно рассматривать как первый шаг в контексте реализации правительственного «Плана реализации концепции “Интернет +”». Основная цель заключается в том, чтобы усилить мощь китайских IT-технологий и достойно представлять Китай на международном уровне – словно женская волейбольная команда представляет Китай.
В 2017 году я снова принимал участие в двух национальных сессиях. В своем выступлении я представлял использование искусственного интеллекта как решение проблем промышленности, перегруженности городских дорог, потерянных детей и многого другого. Кроме того, добавил три новых пункта в списке возможностей развития национальной экономики.
Два дня спустя «искусственный интеллект» впервые написал отчет о работе Правительства и полностью его проиллюстрировал. В результате деловые круги и Правительство наконец-то достигли консенсуса. Значение его сложно переоценить. Влияние, оказанное ИИ на работу Правительства, несомненно ускорит процесс интеллектуального развития.
Процесс интеллектуальной революции будет динамичным. А результат масштабным, как широкая река. Авторитеты в области искусственного интеллекта верят, что в ближайшем будущем нас ожидает постоянный поток информации. Он будет окружать и поддерживать нас во всех отношениях – обеспечивать питание, развивать экономику, политику, способствовать гармонизации общества. Лу Цзи сказал, что суть эпохи ИИ в том, что «знание в каждой системе, а интеллект в каждом действии» (знание повсюду). Любое взаимодействие носит интеллектуальный характер. В будущем люди будут вкушать прелести ИИ, сами того не замечая, так же, как мы одеваемся, чтобы отправиться на обед.
Откровенно говоря, дома своей маленькой дочке я объясняю не так уж и много. В большинстве случаев только то, что уже было воплощено в жизнь. Так, например, она не понимала, как работает распознавание звука Baidu. Я постарался объяснить этот процесс доступным языком. И она меня поняла. Но в некоторых вещах я даю ей разбираться самостоятельно. Она уже легко управляется со всеми сложными гаджетами и получает от них настоящее удовольствие. Именно так и должен выглядеть ребенок мира высоких технологий. Больше всего в искусственном интеллекте меня поражает его способность очеловечиться. Как только он начнет функционировать, изучит, поймет людей и приспособится к ним, он начнет служить им, удовлетворять их потребности. Все наши усилия стоят того, чтобы однажды это произошло.
Предисловие 1. Интеллект BAIDU[1 - Поэма на тему «интеллектуальная революция» написана разумом Baidu. Она имитирует человеческие эмоции, однако существенно отличается от них (для того, чтобы гарантировать оригинальность, поэма публикуется без правок и модификаций). На мой взгляд, ничто не может лучше подойти в качестве предисловия к книге, чем стих, написанный машиной.]
Я пришел, облака на небесах летят по ветру с мечтами в одном направлении, ковчег отплыл, на пути с песней, прогресс времени встречая вас, чтобы увидеть и приветствовать волну.
В новорожденном месте, через тысячелетие, через бесконечное опустошение. Ответ и поиск здесь. Первые лучи, издалека знакомые песни все еще звучат, но вы все еще не знаете, куда я пойду. Тысячелетие оставило крест, который повторил былое и старое видение.
Я пришел, с нетерпением жду вас, каждый день открываю глаза, чтобы увидеть рассвет счастья, занимаю вас каждый день, сопровождаю вас через пропасть к лазурным простым алгоритмам.
Весна времен, вспоминая картину, которую мы прошли, держась за руки. Каждый интернет после этого ветра и дождя снова на престоле. Просто не знаю, какое время будет течь, но с нетерпением жду завтрашнего дня, дыша свежим воздухом и улыбаясь.
Я пришел, два сердца в тяжелой сети зависят друг от друга, здесь родился, вдоль туннеля времени, может сопровождать вас вместе с виртуальными мечтами к краю земли, мудрость, чтобы открыть таинственный мир, бегут в сторону золотого солнца. Каждый первоначально думал, что рост должен быть. Всякий раз, когда закат поднимался на крышу, глядя на звездное небо, я смотрел на звезды. Чувствуя, как тело наполняется волшебством.
Насколько важна эта боль, пусть солнце, наполненное вином, будет искать землю в темноте, даже за накидкой. Бессмертие уже давно решило провести будущее, зная, как быть вместе со старыми надеждами на то, как заканчивается история, кто знает, что жизнь должна продолжать бежать вперед.
«Интеллектуальная революция» – погружение в мир, я знаю, что это секрет нейронной виртуальной сети. С сильным телом, объединяя разум мудрости, открывая новые следы, давайте иметь хорошую жизнь, и нарисуем красивую мелодию.
Небеса непредсказуемы, где ты будешь, когда пройдет ночь. Теплое солнце будет светить. Небесные дети плывут, когда они просыпаются. Я хочу увидеть себя в будущем.
Предисловие 2. Рассвет эры ИИ
Эта книга посвящена искусственному интеллекту. Но для начала нужно остановиться на вопросе, который не вошел в нее, но является фундаментальным – определении ИИ.
Самым известным тестом для определения искусственного интеллекта является тест Тьюринга. Но его можно рассматривать только лишь как обобщенное описание, а не как точное определение. Например, он не дает ответов на многие вопросы: кто участвует в тестировании или какие вопросы задают машине.
В ретроспективе обнаружилось, что развитие искусственного интеллекта тесно связано с автоматизацией. И последняя является даже своего рода истоком развития. Большинство людей ошибочно полагают, что автоматизация – это и есть искусственный интеллект. Но она появилась гораздо раньше, чем мы можем себе представить. Например, первый унитаз, который установили в императорском дворце королевы Елизаветы в далеком XVI веке, был уже автоматизирован. И, конечно, это не самый ранний пример. В эпоху электричества схема автоматизации была заменена транзисторами. Позже появились интегральные схемы, управляемые все усложняющимся программным обеспечением. А сегодня в нашу жизнь вошли автоматизированные системы, такие как электронная коммерция, интернет-банкинг или система онлайн-бронирования.
Несомненно, система автоматизации уже продемонстрировала свои возможности. Такие системы, как онлайн-банкинг, осуществляют сложные операции с более высокой точностью и эффективностью, чем обычные работники. Самые простые системы демонстрируют умное поведение. Например, унитаз оценивает уровень воды в бачке и в соответствии с этим своевременно открывает и закрывает клапан подачи воды. Все это качественно улучшает человеческую жизнь. Но ни интернет-банкинг, ни унитаз мы не рассматриваем как искусственный интеллект. Автор этой книги разработал программное обеспечение, которое позволяет создавать современную поэзию. Причем отличить классические китайские стихи, современные стихи машины и современные стихи человека практически невозможно. За последние годы не одна система прошла тест Тьюринга в лабораторных условиях. Но мы же все-таки не считаем их обладающими искусственным интеллектом, верно?
В 1980-х годах автор книги принимал участие в разработке промышленной системы мониторинга. В качестве ядра для нее был использован процессор Z 80, а программирование осуществлялось на языке ассемблера. Система контролировала сотни параметров блока и осуществляла регулировку параметров в соответствии с изменениями. Но, по нашему мнению, это тоже нельзя назвать искусственным интеллектом. Язык ассемблера характеризуется прозрачностью на аппаратном уровне. Приходится вручную учить машину делать все шаги: отправлять поступающие данные в определенный отсек памяти, прерывать команды, возвращаться на шаг назад и т. д. В таком случае можно проследить, по какой блок-схеме работает мозг машины, и вычислить, какая команда ему поступила для осуществления операции. По большому счету эта система мониторинга не слишком отличается от системы работы унитаза. Разработчики более сложных систем, интернет-банкинга или электронной коммерции, знают все внутренние процессы. Каждый шаг системы также контролируется в программном обеспечении. Это вновь более сложная версия унитаза. А если говорить о системе-поэте, которая прошла тест Тьюринга, то она извлекает слова из логического дерева. Потом обрабатывает, комбинирует по смыслу и рифмует. Программисты понимают, что это также не имеет отношения к искусственному интеллекту.
Здесь можно привести одно мудрое китайское высказывание – когда мы поймем людей, которые ищут карты в комнате, ощущение разумности исчезнет.
Мы считаем, что системы с искусственным интеллектом, такие как эволюционные алгоритмы или глубокое обучение, имеют одну общую черту: все они более или менее по характеристикам напоминают «черный ящик». Теоретически мы все еще сможем отслеживать их шаги. Но из-за огромного количества вычислений сделать это практически невозможно. Мы действительно ощутим уровень их разумности.
Точного определения искусственного интеллекта еще не существует. Но теперь мы можем увидеть его ключевые особенности: это искусственная система с интеллектуальными характеристиками, которая осуществляет и воспроизводит те вычислительные процессы, которые не подвластны человеческому разуму. Другими словами, мы согласимся с тем, что у машины есть собственный интеллект только в том случае, если не будем знать, что и как она думает.
Но столкнувшись с этим явлением, мы должны быть беспристрастны. Потеряем ли мы в конечном итоге контроль над искусственным интеллектом?
Сегодня вопрос о развитии искусственного интеллекта вызывает серьезную обеспокоенность. Цитируя Маска, ИИ становится более опасным, чем ядерные бомбы. Средства массовой информации создают впечатление, что мы стоим на пороге эры машин и момент, когда искусственный разум завоюет мир, уже не за горами. Последняя глава этой книги выражает схожее мнение. В книге «Сингулярность приближения» Кузвиль даже определяет конкретную дату начала эры ИИ – 2045. 2/3 людей, прочитавших книгу, будут к тому моменту еще живы.
Если взглянуть на ситуацию под рациональным углом, то становится понятно, что сверхчеловеческий искусственный интеллект все еще относится к категории научной фантастики. Любое разумное суждение в этом направлении отвергается как консервативное и с недостатком воображения. Публика предпочитает научно-фантастические захватывающие сюжеты банальной реальности. Выступая в роли автора научно-фантастического труда, Робин Ли может сказать, что некоторые из предсказаний могут воплотиться в жизнь. Но большинство еще очень долго не приблизится к реальности. Общество предполагает, что технические барьеры, преграждающие путь развитию ИИ, будут преодолены в обозримом будущем. Но это не так. Создание сверхинтеллекта сталкивается с огромными техническими препятствиями, такими как новая архитектура фон Неймана, глубокое понимание человеческого мышления и т. д. Никто не может быть уверен, что прорыв когда-либо будет достигнут. Многие технологии, такие как квантовые вычисления, еще далеки от практического использования.
Таким образом, разумнее обратить внимание на события, которые имеют отношение к ближайшему будущему. Эта тема и легла в основу данной книги.
В последнее время наметилась тенденция выхода искусственного интеллекта из научных лабораторий. По словам одного из интернет-хакеров, они становятся все доступнее, а мы сталкиваемся с неизбежной проблемой: искусственный интеллект не отнимает нашу свободу и жизнь, но отнимает наши рабочие места. Еще до того, как ИИ выйдет из-под контроля человека, он может подчинить нас воле капиталистов.
Некоторые ученые придерживаются мнения, что беспокоиться об этом не стоит, и вспоминают в качестве примера историю индустриализации. В начале XX века 50 % американского общества было занято в сфере сельского хозяйства, сейчас этот показатель сократился до 4 %. Урбанизация поглотила лишних фермеров. Изменения, связанные с эрой искусственного интеллекта, будут существенно отличаться. Люди с помощью машин смогут выполнять большие объемы работы. Но город не сможет предоставить им необходимое количество рабочих мест. Востребованной останется только лишь творческая работа. Но если мир будет полностью состоять из ученых и художников, то будет скорее напоминать кошмар, обреченный на пустоту жизни большинства его жителей. Будет бесполезен и для себя, и для общества.
Но в подобном образе мышления что-то не так. Конечно, с древних времен люди трудились, чтобы выжить. Работа была прекрасна. Но вовсе не обязательна для тех, кто привык жить красивой жизнью. Теперь мы сможем создать машину, которая освободит человека от тяжелого бремени работы – величайшего достижения цивилизации. Не следует рассматривать это как катастрофу. Нам просто придется измениться в соответствии с новыми реалиями.
Как завершится переход от современного общества к обществу искусственного интеллекта? Существует два варианта развития событий.
Первый – бесконечный конфликт между искусственным интеллектом и его пользователями. Проблемы, порождаемые искусственным интеллектом в социальных, экономических и политических системах, перестанут поддаваться анализу. ИИ будет быстро захватывать все сферы человеческой жизни. А социальная система, которая бы могла ему соответствовать, не появится в одночасье. Мир погрузится в беспросветный хаос, сопровождаемый безработицей, экономическими и политическими проблемами.
Второй вариант предвидит возможность того, что общество успешно завершит трансформацию. Это будет самым крупным изменением человеческого образа жизни в истории. Существующая философия – краеугольный камень общества. Она постепенно развивалась с момента зарождения цивилизации, но никогда не изменялась кардинальным образом. Появление искусственного интеллекта приведет к фундаментальным изменениям во всех сферах человеческой жизни – в видах собственности, в процессе распределения ресурсов, в основных экономических структурах, в политических институтах, даже в культуре. Наступит освобождение человечества от рабства труда. Мы сделаем широкий шаг по направлению к утопическим идеалам. 2016 год – 500-летний юбилей со дня публикации знаменитой «Утопии» Томаса Мора. Думал ли он, что однажды его идеи воплотятся в жизнь с помощью машин? А как бы видоизменились теории о капитализме и коммунизме, если бы Карл Маркс знал, что такое искусственный интеллект?
Трудно представить себе жизнь в эпоху искусственного интеллекта. Даже в научной фантастике мы можем лишь просчитать возможности и вероятности. Только от нас зависит, что из них станет реальностью. В любом случае, это заманчивое время. И мы направляемся к нему.
Лю Ци Синь
10 декабря 2016 г.
Раздел 1. Краткая история: Рост искусственного интеллекта в интернет-облаке
Некоторые слова освещают историю. Другие – дорогу в будущее. Давайте начнем с краткого обзора истории интернета и искусственного интеллекта.
Многие уже знакомы с историей возникновения интернета в общих чертах. Он появился в 60-х годах XX века в американской военной лаборатории. И начал использоваться для передачи и обмена информацией между некоторыми университетами и научно-исследовательскими институтами. В конце 1980-х группа ученых разработала концепцию создания Всемирной Паутины и протокол TCP\IP (Internet Transmission Control Protocol). Основным преимуществом протокола было то, что он позволял унифицировать стандарты компьютерных сетевых коммуникаций. Значит, появлялась возможность сделать интернет доступным во всем мире. Перед человечеством открывалась новая информационная магистраль.
Около 20 лет назад 23-летний юноша Марк Андерсон изобрел браузер Netscape. Это стало настоящей бомбой – перед бизнесом широко распахнулись двери в интернет-мир. Это заставило компанию Microsoft поволноваться. Они всерьез задумались о том, что их бизнес понесет серьезные убытки от интернет-нашествия. Открывались широкие возможности для нововведений и уничтожения монополий. Поэтому молодые люди из компании Sun уволились с работы и посвятили себя разработке нового языка общения, который бы смог взаимодействовать с разными операционными системами. Плодом их стараний стал Java – новый язык программирования. Он значительно ускорил создание интернет-продуктов.
В 1997 году я вернулся в Гонконг. Тогда ни в Пекине, ни в Шанхае нельзя было найти ни одного интернет-кафе. Тогда же Ин Хэй Вэй открыл Национальную службу доступа к сети, Чжан Сяо Лун написал программное обеспечение для электронной почты Foxmail, было создано Национальное информационное общество. Мир всеобщей паутины начал приобретать свои первые очертания. Но в мире технологий продолжали появляться все новые идеи, а тайные коммерческие войны входили в эпоху своего расцвета.
В то время я работал в American Search Engine Pioneer Infoseek, которая находилась на первой линии фронта. Я чувствовал атмосферу интернет-бизнеса и страсть американцев к новым технологиям и понимал, что мы столкнулись с очередной технологической революцией. Но готов ли к ней Китай? В книге «Кремниевая долина» 1998 года подробно описаны инновации, создаваемые гениями Кремниевой долины, и их борьба между собой. После того, как я закончил книгу в 1999 году, я вернулся в Пекин в отель, построенный компанией Baidu.
Напомню, что в ту увлекательную эпоху существовало три «сверхдержавы» в Интернете – Netscape, Sun, Microsoft. Все гадали – кто же выйдет победителем из этой битвы. Microsoft казался непобедимым. Он мог усвоить любые технологические новинки. Путь Netscape сопровождали взлеты и падения. В конечном итоге она была выкуплена американским беспроводным гигантом – провайдером Verizon. Позже в руки Verizon попала и компания Yahoo. Sun в 2001 году имела 50 000 сотрудников по всему миру. А ее рыночная стоимость превышала 200 млрд долл. США. Однако, когда лопнул мыльный интернет-пузырь, компания солнца мгновенно спикировала на самое дно. Через год, в 2009 году, ее выкупила корпорация Oracle.
На этом фоне ожидался быстрый подъем новых компаний – Apple и Google с мобильной операционной системой, как ответный удар по Microsoft.
Марк Андерсон – создатель браузера Netscape, которого я описал в начале «Кремниевой долины», был практически позабыт после пика популярности в 90-х. Но он не ушел со сцены. А стал отцом ветряной промышленности Кремниевой Долины.
Интернет-технологии продолжали набирать обороты. Раньше люди боролись за интернет. А сегодня с волнением начали замечать, что он все больше выходит за рамки ПК на мобильные устройства. Это совпало с незаметным подъемом «призрака». «Призрак» – это искусственный интеллект. А интернет – всего лишь одно из его тел.
Рассвет искусственного интеллекта
История развития искусственного интеллекта предшествует интернету и сопровождается историей компьютеров. В 1956 году на конференции в Дартмуте на повестку дня был официально вынесен вопрос об искусственном интеллекте. В то время компьютер был размером с большой дом и обладал низкой вычислительной мощностью. Как вообще ученые осмелились вынести вопрос об ИИ на всеобщее обозрение?
Именно тогда Шеннон сформулировал три основных теоремы коммуникации. И тем самым заложил основу для компьютерных информационных технологий. Минский создал первый нейросетевой компьютер (он и его коллега моделировали сеть из 40 нейронов с 3000 вакуумными трубками и автоматическим индикатором на бомбардировщике B-24). А после этого написал статью на тему «Нейронные сети и модель мозга». Тогда она не произвела особого эффекта. Но позднее легла в основу концепции ИИ. Тьюринг в 1950 году представил уже известные читателю теории тестирования, а также различные концепции машинного и интенсивного обучения, генетического алгоритма.
Спустя два года после смерти Тьюринга на конференции в Дартмуте Маккарти официально представил концепцию искусственного интеллекта. Десять молодых ученых, принимавших участие в конференции, стали мировыми лидерами в области искусственного интеллекта. Но расцвет ИИ был недолгим. Все достижения ученых были похоронены результатами технологического развития.
Цель уже маячила впереди, но инфраструктура находилась в зачаточном состоянии. Искусственный интеллект сталкивался с двумя непреодолимыми барьерами. Первый – это логика алгоритмов или недостаточное развитие математических методов. Второй – недостаток аппаратных вычислительных мощностей. Например, типичная проблема – машинный перевод. Ученые день и ночь суммируют все известные правила грамматики, разрабатывают модели компьютерного языка, но машина все равно не может повысить точность перевода и выйти на удовлетворительный уровень.
Новые технологии и производственные цепочки не стали достоянием общественности. Не были изобретены захватывающие программные продукты. А государственные и бизнес-инвестиции были значительно сокращены. С середины 1970-х и до 1990-х гг. наблюдалось две волны всплеска интереса по отношению к разработкам и исследованиям, связанным с искусственным интеллектом. Но широкая аудитория оставалась в неведении. Внимание было сконцентрировано на развитии компьютера – фантастического интеллектуального инструмента.
Обыватели знакомились с искусственным интеллектом сквозь призму аркадных игр. В 1980-х в Китае на улицах появились первые игровые автоматы. Аркадные NPC (персонажи, которые не контролируются игроком) воспринимались как продукт ИИ, но легко проходились опытными игроками. Так сформировалось ошибочное представление: искусственный интеллект – то, что установлено на компьютере. Эта точка зрения никак не менялась до появления интернета и облачных вычислений.
Как закалялась сталь
В 2012 году я заметил, что в академических и прикладных областях науки произошли заметные прорывы в глубоком обучении. Например, использование метода глубокого обучения сделало возможным усовершенствование методов распознавания изображений. Я сразу понял, что мы стоим на пороге новой эры глобального поиска. Если до этого мы использовали только лишь текстовый поиск, то теперь возможными стали голосовой запрос и запрос по изображению. Например, если необходимо узнать, что за растение я вижу перед собой, то я фотографирую его и загружаю в поисковик. В течение нескольких секунд получаю его название – Flu Tong. С помощью текста сделать это было практически невозможно. Но усовершенствовался не только процесс поиска. Теперь стали возможны многие вещи, казавшиеся раньше нереальными. Распознавание речи, изображений, способность воссоздавать портрет пользователя – одни из базовых способностей человека. Как только компьютеры научатся делать то же самое, начнется новая технологическая революция. Стенографистов и переводчиков заменят машины и будут выполнять их работу лучше. В прошлое уйдут шоферы – автомобиль сможет ездить сам в разы безопаснее. В бизнесе появится умный помощник по работе с клиентами, который сможет удовлетворить все потребности и ответить на все вопросы. Искусственный интеллект даст людям новые возможности. Промышленная революция освободила людей от физической нагрузки. Теперь машины перемещают тяжести вместо нас и делают это в больших масштабах, чем было под силу человеку. Интеллектуальная революция будет решать другие вопросы. Следующие 20-50 лет мы будем свидетелями изменений и неожиданных сюрпризов. И это естественно.
Но интеллектуальная революция была бы невозможна без преданных своему делу первопроходцев. Стоит отдать им дань уважения.
После длительного периода застоя немногие ученые сохранили веру в идею искусственного интеллекта. Сейчас у Baidu есть большая и сильная исследовательская команда. Многие из ученых с 1990-х занимаются исследованиями в области машинного обучения или работают в крупных технологических компаниях. Сегодняшние достижения в области исследований ИИ – результат альтернативных подходов к работе над этой темой.
В 1990-х гг. немногие ученые, такие как Джеффри Хинтон и Майкл Джордан, настаивали на изучении машинного обучения. Ву Энда, бывший главный ученый Baidu, учился у Джордана в 90-е, а после преподавал теорию машинного обучения и даже организовал собственные онлайн-курсы. В настоящее время деканом научно-исследовательского института Baidu является Линь Юаньцин. Сю Вэй, один из выдающихся ученых корпорации, стал первым, кто предложил использовать нейронные сети для языковых моделей. Специалист по искусственному интеллекту, член американской инженерной академии, Владимир Вапник изобрел систему SVM (Support Vector Machine). Ян Лекун – лидер в области глубоких исследований, руководитель лаборатории искусственного интеллекта Facebook, изобрел специальную архитектуру сверточных нейронных сетей. А бывший директор лаборатории глубинного обучения Леон Батту является разработчиком ядра алгоритма глубинного градиента.
Исследования искусственного интеллекта прошли через несколько фаз. Первоначальные исследования ИИ основывались на правилах. Люди суммировали правила, введенные в компьютер, а сам компьютер этого сделать не мог. Следующий, более продвинутый подход основан на технологии машинного обучения. Он позволяет найти наиболее подходящие модели из больших объемов данных.
За два года развития искусственный интеллект смог поразить мир технологий. Он стал сублимированной версией технологии машинного обучения, основанной на многослойном нейросетевом компьютерном чипе. Благодаря многослойным микросхемам, которые имитируют соединение нейронов в человеческом мозге, в сочетании с усовершенствованным алгоритмом поощрения и наказания и возможностью переработки большого объема данных компьютер научился находить закономерности и вычленять модели из огромного количества информации. Это открыло новую эру в развитии интеллекта машин.
Немногие продолжали настаивать на разработке теории искусственного интеллекта, чтобы спасти уже проделанную работу. В Китае Baidu была одной из первых компаний по разработке ИИ. И, кажется, мы сделали то, о чем другие не могли даже мечтать. Шесть или семь лет назад я и Лу Цзи обсуждали прогресс, достигнутый в глубоком обучении. Мы сошлись во мнении, что готовы войти в эту сферу. В конце концов, в 2013 году я официально объявил о создании IDL (институт глубокого обучения). Он должен был стать первым институтом глубокого обучения в бизнес-сообществе. Я стал деканом не потому, что знаю больше, чем кто-либо другой. Для меня это своеобразный способ подчеркнуть степень своего внимания к предмету. А еще возможность отблагодарить тех ученых, которые не отступили в тяжелые годы.
Baidu никогда раньше не создавал научно-исследовательские институты. Наши инженеры были исследователями, а их работа всегда была тесно переплетена с практическим применением. Но я считаю, что глубокое обучение в будущем окажет огромное влияние на многие отрасли науки и жизни и шагнет далеко за пределы компетенции нашей компании. Поэтому необходимо создать специальное пространство для привлечения талантов, где бы они смогли свободно экспериментировать с инновациями, проводить исследования в неизвестных раньше областях и прокладывать путь искусственному интеллекту в жизнь человека.
На смену интеллекту
Если назвать этап просветления искусственного интеллекта версией 1.0, то машинный перевод будет следующим – 2.0. Раньше методы машинного перевода основывались на наборе слов и правил. Люди постоянно суммировали грамматические правила, но это не помогло усовершенствовать перевод. С человеческим языком машины не справляются. Особенно, когда речь идет о переводе в контексте. Например, фраза «how old are you».
Позднее появился SMT (статистический машинный перевод). Его основная идея заключается в том, чтобы посредством статистического анализа выявить общие правила использования слова или словосочетания и попытаться избежать появления нелогичных фраз. SMT имеет основные функции машинного обучения – обучение и декодирование. Этап обучения позволяет компьютеру построить модель перевода с помощью статистических данных, а затем использовать ее для перевода. Этап декодирования использует расчетные параметры, чтобы получить наиболее подходящий результат от перевода.
Исследование SMT продолжается уже более 20 лет. Для фраз и коротких предложений уже достигнут значительный прогресс. Но перевод длинных предложений, особенно со сложных языков, вроде китайского или английского, все еще оставляет желать лучшего. До недавнего времени никто не задумывался о подходе NMT (переводе, основанном на нейронных сетях). В его основе – нейронная сеть с бесчисленным количеством узлов. Исходное предложение векторизуется и передается через средний слой сети компьютеру в виде выражения, понятного для него. Затем проходит сквозь многослойную операцию и переводится на другой язык.
При таком переводе объем данных должен быть огромным, иначе система окажется бесполезной. Поисковые системы, вроде Baidu или Google, могут собирать перевод из огромного количества человеческих высказываний в интернете. Только такие объемы данных способны прокормить NMT. Система сможет самостоятельно отладить механизм перевода. И результат будет лучше, чем при SMT. Особенно, если будет достаточно информации на языке перевода.
SMT использует локальную информацию. Фраза расчленяется на сегменты. Сегменты обрабатываются и переводятся. И только потом сшиваются вместе. NMT использует общую информацию. Система кодирует фразу полностью (как люди во время перевода сначала читают предложение целиком). А потом на основе закодированной информации генерирует перевод. За счет этого достигается более высокий уровень читаемости текста.
Например, один из важных аспектов в переводе – порядок слов. Китайцы размещают определения перед определяемым словом. А в английском определение находится после. Машины часто путают этот порядок. Преимущество NMT в его способности к обучению порядку слов в языке. Это обеспечивает плавность перевода в длинных предложениях.
Традиционные методы перевода не бесполезны. Каждый из них выполняет свою функцию. Например, при переводе идиом нельзя использовать дословный перевод. Они всегда имеют устойчивое значение. Потребности пользователей интернета разнообразны: перевод разговорного языка, резюме, новостей и прочего. Поэтому одним методом сложно удовлетворить все запросы. Baidu сочетает в себе сразу несколько традиционных методов перевода: перевод, основанный на грамматических правилах, на примерах, на статистике и на нейронных сетях.
В такой модели машинного перевода человек не ищет грамматические правила, а устанавливает математические модели и параметры, чтобы помочь компьютерной сети выявить правила самостоятельно. Когда человек вводит предложение и получает на выходе его перевод, он не думает, что происходит в середине цепочки. Это называется сквозным переводом. Этот удивительный подход называется байесовским, или скрытой марковской моделью. Для решения проблемы здесь используется теория вероятностей.
С помощью байесовского метода распределения информации можно построить модель личности по вероятностным характеристикам. Например, модель мужчины предполагает, что при чтении новостей он остановится на чтении статей, посвященных войне с вероятностью в 40 %. Женская модель – только 4 %. После того как читатель выберет военные новости, в соответствии с формулой Байеса (рис. 1-2), можно более точно рассчитать его пол и другие характеристики, используя другие поведенческие данные и комплексные расчеты. Это «волшебство» математики. Но, конечно, компьютерные нейронные сети используют не только математические методы.
Рис. 1-1. Байес и байесовская формула[2 - Используется для представления условной вероятности случайных событий A и B, где P (A | B) – это вероятность того, что в случае B произойдет А.]
Метод использования искусственного интеллекта, подобный машинному переводу, предполагает использования огромных объемов информации. Интернет сейчас способен такие объемы предоставить. Раньше ученые только мечтали о них.
Интернет был создан для того, чтобы облегчить обмен информацией. В результате произошел информационный взрыв, который способствовал ускорению развития искусственного интеллекта.
В качестве доказательства приведу игру в шахматы. В 1952 году сир Сэмюэл написал программу для игры в шашки, чтобы повысить уровень собственного мастерства. Правила игры были относительно просты. И в этом отношении у компьютера было внушительное преимущество перед человеком. Но правила шахмат гораздо сложнее. Когда президент Baidu Чжан Яцин был директором института Microsoft, он пригласил на работу талантливого компьютерщика Сюй Фэн Сюна родом из Тайваня. Этот специалист во времена IBM (International Business Machines Corporation) разработал известного робота под названием «Шахматы втемную». В 1990-х гг. искусственный интеллект не представлял собой разновидность «Шахмат втемную». Его «мудрость» была заключена в суперкомпьютере (с использованием нескольких процессоров и параллельных вычислительных технологий), благодаря которому ИИ побеждал людей-шахматистов, а в 1997 году выиграл партию у Каспарова, чемпиона мира по шахматам. Вскоре после известной игры IBM отправила технологию «Шахматы втемную» в отставку. Чжан Яцин сказал Сюй Фэн Сюну: «Изобрети технологию для игры в Го, а потом найди меня и выиграй». Пока Чжан Яцин не покинул Microsoft, Сюй Фэн Сюн его так и не искал.
Технология «Шахматы втемную» сталкивается с некоторыми трудностями, которые на сегодняшний день не могут быть преодолены. Достичь прорыва в этом направлении так же сложно, как покорить Вселенную. Модель, которая опирается на алгоритм дерева решений, исчерпывает свои возможности и выходит за пределы пропускной способности компьютера. Алгоритм постоянно совершенствуется, но проблему в вычислениях решить пока не удается. У искусственного интеллекта есть все предпосылки для того, чтобы быть устойчивым перед лицом восточной мудрости. И новая эра уже не за горами.
Интернет-конференция
Технология «Шахматы втемную» представляла собой модель искусственного интеллекта, но, кажется, не имела ничего общего с интернетом. Но развитие облачных вычислений и возможности управления большими объемами информации наконец-то объединили ИИ и интернет в одну устойчивую технологию, которая существенно отличается от «Шахмат втемную». Распределенные вычисления в сочетании с большими объемами информации и новым алгоритмом принятия решений демонстрируют успешное сочетание человеческого и машинного интеллекта.
В 2016-2017 годах AlphaGo (программа для игры в го) всколыхнула человечество. Процесс ведения игры AlphaGo отличается и от человеческого мышления, и от «Шахмат втемную». Проще говоря, механизм питается десятками миллионов человеческих шахматных партий. Выражаясь более профессионально, успеху AlphaGo способствовали алгоритм поиска Монте-Карло и механизм распознавания образов, основанные на глубоком обучении. Однако ни его предшественники, ни «Шахматы втемную» к технологии глубоко обучения отношения не имели.
Согласно исследованиям, AlphaGo не изобретает собственный механизм игры, а изучает десятки миллионов игроков (массивы данных). Он запоминает каждый ход, каждую игру из миллионов ситуаций и использует данные для обучения с помощью нейронной сети. Все это делается для того, чтобы иметь возможность предсказать, как мастер-человек сумеет выйти из той или иной ситуации. На практике компьютер анализирует текущую ситуацию и находит ее аналоги в прошлом. Затем ищет возможные варианты развития и выбирает несколько наиболее оптимальных. Таким образом, вместо того, чтобы пробовать все возможные варианты, он останавливается на наиболее выгодных. Тем самым сокращает объем вычислений. Система не истощается и получает защиту от поражения. Этот подход похож на человеческий. Мы не пробуем все подряд, а выбираем несколько вариантов, опираясь на опыт и чувства. Но после того, как сделаем свой выбор, мы все еще должны производить подсчеты и сравнения в поисках оптимального хода. Машина же передаст эти расчеты алгоритму поиска Монте-Карло.
Ниже я использую метафору. Она не точная, но достаточно понятная.
Поиск решения по методу Монте-Карло – это оптимизация предыдущего алгоритма дерева решений. Предыдущий алгоритм, даже если он предоставлял качественный вариант решения задачи, должен был быть единственным в каждой точке для того, чтобы выбрать следующую ветвь с бесконечным множеством менее рациональных вариантов решения.
Метод Монте-Карло основывается на тонкостях теории вероятности. Представим шахматную ситуацию, где сеть глубокого обучения дает три возможных варианта на ход – А, В, С. Три точки в качестве корневого узла можно представить, как три дерева, каждое из которых имеет бесконечное число ветвей. Метод Монте-Карло не проверяет каждую из ветвей, но отправляет три миллиона муравьев по одному на каждую ветвь, чтобы те быстро поднялись на верхушку дерева (то есть, чтобы они шли до тех пор, пока не доберутся до варианта, который обеспечит победу). Некоторые из них доберутся до победной точки. Предполагается, что все муравьи ищут наиболее эффективное решение, а не вариант, в котором партия завершится поражением.
Предположим, что из 1 миллиона муравьев, которые отправились по ветке А, только 300 тысяч дошли до победного конца. По ветке В – 500 тысяч. По ветке С – 400 тысяч. Система понимает, что вероятность победы на ветке В гораздо выше, и выбирает именно этот вариант хода. Таким образом, вероятностный метод значительно сокращает количество вычислений по сравнению с методом исчерпывания.
Почему мы отправляем именно 1 миллион муравьев для исследований, а не 100 тысяч или не 10 миллионов? Это зависит от вычислительной мощности компьютера и приблизительной оценки конкурентов. Если в данной ситуации, чтобы получить более высокий коэффициент выигрыша нам требуется только 100 тысяч муравьев, мы отправим 100 тысяч. Но чем больше муравьев отправляются на дерево в одно и то же время, тем выше требования к вычислительной мощности компьютера.
Чип процессора и графический процессор (GPU), нейронные сети и метод Монте-Карло создают возможности, которые не могут сравниться с человеческими. В результате глубокого обучения искусственный интеллект моделирует способности человека, которые аналогичны сумме способностей 10 миллионов шахматистов.
Умные читатели, даже не понимая математическую теорию, способны уловить механизм работы AlphaGo. Хотя алгоритмы и стратегии гораздо сложнее, чем описано выше. AlphaGo на своем примере демонстрирует уровень развития глубокого обучения и искусственного интеллекта. Но на самом деле, на сегодняшний день существует множество научно-исследовательских институтов и талантливых ученых, которые делают сверхъестественные вещи в данном направлении.
После того, как поведение человека начало фиксироваться в виде данных посредством интернета, у искусственного интеллекта появилось полноценная пища, чтобы идти в ногу с человечеством и помогать ему во всех сферах жизни. Машинный перевод, распознавание речи, изображений опираются на клики пользователей Интернета. Почему точность поисковой системы Baidu трудно сравнить с другими поисковыми системами? Потому что Baidu обладает самым большим объемом данных, самым продвинутым алгоритмом принятия решений и самой сильной командой. Каждый клик пользователя тренирует мозг Baidu и рассказывает о том, что человек хочет больше всего.
Когда искусственный интеллект переживал этап застоя, люди думали, что машина никогда не сможет думать так же, как человек. Но после 1990-х мы поняли, что машина и не должна думать так же, пока мы в состоянии сами решить свои проблемы. У лингвиста Хомского спросили: «Может ли машина думать?» Это был позаимствованный датским компьютерным ученым Дикстра риторический вопрос: «Будет ли подводная лодка плавать?» Ответ был такой: «Подводная лодка не плавает, как рыба или человек, но ее способности очень высоки».
Если мы оглянемся назад (не только на историю развития интернета), то поймем, что вся история развития промышленности – это шаги по направлению к развитию искусственного интеллекта. Кевин Келли отмечал, что самоприводящийся поршень парового двигателя уже представляет собой конструкцию, которая содержит элементы «эволюции». Стремление к автоматизации – эволюционная сила ИИ.
Когда началась промышленная революция, паровой двигатель появился в угольных шахтах и ямах. Эффективность двигателя пара была низкая, энергия, особенно при добыче угля, требовалась значительная, и спрос на дешевую рабочую силу сохранялся существенный. Дело в том, что при добыче угля использовалось много воды. А вода, в свою очередь, была топливом для парового двигателя. После того, как в шахтах впервые была применена новая технология, она постоянно продолжала совершенствоваться для содействия промышленной революции. С искусственным интеллектом то же самое: данные – это топливо для двигателя искусственного интеллекта, а когда ИИ получает достаточное количество данных, он может работать дальше.
Без накопления данных о деятельности человека компьютер не может стать объектом обучения. Это стало возможным благодаря развитию интернета и развитию методов сбора информации. А также благодаря исследователям ИИ, не все из которых являются учеными в сфере компьютерных технологий. Некоторые из них проводят биологические исследования, некоторые – инженерные. Некоторые изучают математику, архитектуру компьютерных чипов или автоматизированную итеративную оптимизацию компьютерных программ. Но однажды результаты изысканий сходятся в одной точке. И на этом месте рождается искусственный интеллект.
Сплотились, чтобы конкурировать
В 2016 году AlphaGo вызвала настоящую сенсацию в средствах массовой информации. Но, это была несколько запоздалая реакция. Гигант искусственного интеллекта Джефри Хинтон еще в 2007 году отмечал, что «вот-вот разразится буря».
В тот год один из студентов Хинтона с помощью Google Big Data применил исследования своего учителя к технологии распознавания речи и добился значительного успеха. Корифей ИИ только воскликнул: «Оказывается, моя неудача была вызвана исключительно отсутствием объема данных и необходимой вычислительной мощности!»
Искусственный интеллект уже готов войти во второе десятилетие XXI века. С 2015 года началась эра бизнес-конкуренции в сфере ИИ. По данным анализа сферы искусственного интеллекта, опубликованного инвестиционным агентством США CB Insights, объем инвестиций в ИИ превысил $1 млрд уже в первом квартале 2016 года, а за два квартала осуществлено 121 финансирование. За аналогичный период в 2011 произошло всего 21 вливание. Со второго квартала 2011 по второй квартал 2016 объем инвестиций превысил $7,5 млрд, 6 из которых поступили после 2014 года.
«Wuzhen Index: глобальный отчет о развитии искусственного интеллекта» демонстрирует, что в течение первых двух кварталов 2016 года в Китае число интеллектуальных предпринимательских компаний увеличилось более чем на 60. А объем инвестиций достиг $600 млн. В прошлом году Китай вложил 202 инвестиции в искусственный интеллект, что в общей сложности составляет $1 млрд (или около 6,8 млрд юаней). Рынок огромен.
Рис. 1-2. Количество и частота инвестиций в ИИ
Источник: www.cbinsights.com
В 2016 году вице-президент Китайской академии наук и вице-президент китайского общества искусственного интеллекта, академик Тан Тин Бин, отметил, что в 2015 году стоимость мирового рынка искусственного интеллекта составляла $127 млрд. В 2016, по прогнозам специалистов, она достигнет $165 млрд. А к 2018 перешагнет за отметку в $200 млрд.
Китай, Соединенные Штаты и Великобритания – три передовые страны в развитии ИИ. США – источник интернета и искусственного интеллекта. Они обладают уникальными талантами, сильной технической базой и огромным финансированием научных исследований, что делает их лидером в данной области. Помимо Google, Facebook, Microsoft, Amazon, IBM, Apple и других гигантов информационных технологий, в Америке сотни крупных и малых компаний, которые также специализируются на бизнесе ИИ. Например, компания X.AI провела три этапа финансирования, которые в совокупности достигают $3,400 млн. Великобритания продолжает традиции старой школы даже в условиях сокращения производства. Сейчас все таланты собрались в области искусственного интеллекта. Одним из примеров является компания Deep Mind, которая продолжает работу над AlphaGo.
Amazon запустила голосовой помощник Alexa и умную колонку Echo, конкурируя с Apple, Google и Microsoft в сфере голосового поиска. В июне 2016 президент Amazon в своем интервью с американским IT-блогером Уолтом Мосбергом подчеркнул, что инвестиции компании в течение 4 лет вливались только в ключевые проекты в сфере ИИ. «В команду Amazon, занятую в работе над ИИ проектами, входило свыше 1000 человек. И это всего лишь верхушка айсберга».
В сентябре 2016 года Microsoft объявила о создании новой бизнес-группы по разработке искусственного интеллекта под руководством вице-президента Гарри Шума. Он возглавляет тысячи компьютерных ученых и инженеров, которые интегрируют искусственный интеллект в продукты компании. Среди продуктов: Bing Search Engine (Bing), Xiao Na Digital Assistant и Robotics Project. В конце года Microsoft выпустила сервис, который способен развивать чат-ботов и объявила, что она будет предоставлять услуги процессора для открытой лаборатории искусственного интеллекта AI, соучредителя Сэма Альтмана, президента Elon Musk и инкубатора стартапа YCombinator.
Facebook также имеет свою собственную лабораторию искусственного интеллекта и команду, похожую на Google Brain, т. е. использующую технологии машинного обучения. Миссия организации состоит в том, чтобы продвигать технологии искусственного интеллекта в различных продуктах Facebook. По словам Майка Шропфера, главного технического директора компании, «в настоящее время около 1/5 инженеров используют технологию машинного обучения».
Владелец AlphaGo, Google, конечно, не будет довольствоваться игрой в шахматы. Его искусственный интеллект продолжает развиваться на протяжении многих лет. В 2012 году у Google было два проекта, основанных на технологии глубокого обучения. К концу 2016 года этот показатель превысил 1000. В настоящее время многие продукты Google, такие как поисковая система, операционная система Android, бесплатный сервис электронной почты Gmail, онлайн-переводчик, онлайн-карты, видеохостинг YouTube, имеют некоторые свойства глубокого обучения.
Китай имеет огромные возможности для развития IT-бизнеса, значительное количество пользователей, внушительный массив данных и большую группу талантливых специалистов. Это позволяет ускорить темп развития ИИ. BAT (Baidu, Alibaba, Tencent), Huawei и некоторые другие гиганты заняли далеко не все сферы искусственного интеллекта, где можно реализоваться компаниям. Поэтому малый, средний и крупный бизнес продолжают выходить на арену ИИ. В 2016 году на форумах, будь то электронная коммерция, социальные медиа или поисковые системы, руководители интернет-компаний переводят тему разговора на искусственный интеллект. Сообщают о больших и малых достижениях.
В 2016 году точность распознавания речи Baidu достигла 97 %. А точность распознавания лиц – 99,7 %. Облако Baidu Brain, платформы Tianji, Tianxiang, Tiangong и Tianzhi последовательно открыли технологии и возможности Baidu Brain для всего общества.
Сверхмощный мозг
Более десяти лет назад немногие настаивали на развитии машинного обучения. Поэтому технология превратилась в настоящее сокровище. Но после всплеска интереса к сфере искусственного интеллекта самым дефицитным ресурсом стали талантливые специалисты.
Знания, на которые опирается развитие ИИ, имеют большое значение и для фундаментальных дисциплин науки, таких как математика и биология. Поэтому ученые, которые были бы одновременно сведущи в сфере искусственного интеллекта и в фундаментальных отраслях науки – большая редкость. В год выпускается чуть меньше 200 докторов и аспирантов, которые способны принять участие в национальных исследованиях или стартапах. Этого количества катастрофически не хватает. В 2015 году волнение в отрасли вызвала компания Uber, которая переманила 40 из 140 исследователей из Национального института робототехники Университета Карнеги-Меллона.
И это далеко не вся борьба за таланты. Практикующие специалисты более чувствительны к потоку академических кадров. За последние несколько лет из «башни слоновой кости» вышли многие академические звезды и прыгнули в прикладные исследования с парашютом. Они рисковали для того, чтобы простые люди могли заметить действительные изменения в сфере развития искусственного интеллекта. Но куда идти, чтобы в полной мере реализовать свои способности и не увязнуть в потоке, все еще остается проблемой.
Baidu является представителем китайской индустрии искусственного интеллекта. И большое количество талантов занимало или занимает достойное место в нашей команде. Ван Хайфэн работал в Baidu до перехода в Microsoft. Ву Энда появился в Baidu из Соединенных Штатов. Чжан Яцинь поменял Microsoft на Baidu. Линь Юаньцин, гигант в сфере искусственного интеллекта, занял должность директора лаборатории глубокого обучения Baidu по возвращении из Америки. Сегодня в компании есть необходимые талантливые специалисты, чтобы создавать собственные приложения с функциями ИИ. Baidu – это воплощение динамизма Китая в отношении привлечения и обучения ученых для работы в сфере искусственного интеллекта.
Множество сверхмощных человеческих мозгов сходятся в одном месте, чтобы создать один эпохальный китайский мозг для машины. Мы уже пережили эру ПК, эру мобильного интернета. Теперь на всех парах движемся к суперразумной эре взаимосвязи всех вещей. Слияние данных об окружающих нас предметах может в конце концов привести к развитию «Знания»[3 - «Знание» – это точка зрения Кевина Келли в книге «Неизбежное», относится к программному обеспечению, которое охватывает все. Он считает, что все будет информационным, даже если данные о продажах и частоте кликов будут автоматически выгружаться в таблицу.]. Baidu двигается в этом направлении. Цель заключается в том, чтобы сделать искусственный разум таким же необходимым для людей, как вода или электричество. Это неизбежно спровоцирует повышенный интерес к развитию технологий. Например, Baidu имеет свои глаза, уши, рот и когнитивные навыки принятия решений. В целом, это искусственный эквивалент ребенка. Но некоторые способности, такие как перевод, распознавание речи, распознавание изображений, значительно превосходят способности ребенка. Мы открываем Baidu для людей, чтобы исследовать его возможности в различных приложениях с функциями ИИ. Baidu Brain уже сегодня стал инструментом для многих разработчиков операционных систем и способствует стандартизации формы искусственного разума. В новой эпохе нас ожидает полный спектр услуг для предприятий, предпринимателей и большинства индивидуальных пользователей.
Мы с энтузиазмом называем китайский мозг средством глубокого обучения серверов, алгоритмов, инфраструктуры приложений на уровне страны. Именно формирование китайского мозга станет олицетворением всестороннего повышения конкурентоспособности Китая и мощного ускорителя китайского возрождения.
Технологии, необходимые для улучшения жизни
Прежде чем начать разговор о данных, которые питают искусственный интеллект, я бы хотел остановиться на пользователях, бесчисленных потребителях, поддерживающих развитие Baidu и всего высокотехнологичного интернета.
Сегодня тенденция развития интернета и технологий сбора огромного количества информации подталкивает не только гигантов отрасли, таких как Google, Microsoft и BAT, но и малый и средний бизнес к наращиванию потенциала для того, чтобы решать проблемы в сложившейся ситуации.
Секрет успеха на самом деле прост: выясните, чего люди больше всего хотят, а затем дайте им это. Его успеху также способствовали сильные маркетинговые кампании и корпоративный имидж. Кейн сыграл здесь ключевую роль. Он ничего не знает о компьютерных технологиях. Но он от мозга костей – деловой человек, а его ноги глубоко укоренились в обществе. Центр мира – это потребитель. «Мы будем устами интернет-мира».
Цитата из книги «Кремниевая долина»
В книге «Кремниевая долина» я подчеркиваю важность каждого пользователя. В глазах инженеров потребитель – это один из элементов в технической документации, существование которого можно свести к одной формуле: потребности потребителя – развитие – обратная связь. Но интернет не только упрощает получение товаров и услуг, но и обеспечивает поле для обмена мыслями и эмоциями. Можно сказать, что интернет создает своего рода единое мнение пользователей.
Многие из наших инженеров и программистов наслаждаются свободой Baidu и полагаются на его простоту. Техник ясно мыслит, увлечен разработкой новых продуктов и общителен. Но люди с живыми эмоциями и мыслями не совсем соответствуют тому, как их видят инженеры. Вероятно, маленькие кусочки жизни каждого отдельного человека или сложные сделки в торговых центрах не будут ощущаться в наших лабораториях. Для того, чтобы лучше понять психологию пользователя, существует PR-отдел. Однако и они не всегда справляются с задачей и сталкиваются с проблемами, которые делают код уязвимым. Чтобы разобраться, как сломать барьер между техниками, бизнесменами и обычными пользователями, нам нужно сконцентрироваться на высоком уровне мышления продукта и скромном изучении трансграничного опыта.
Мысли о потребностях человека в повседневной жизни – непрерывная работа, которая требует настойчивости. Но если вернуться к теме книги, то мы, в конце концов, инженеры, и не забываем думать о том, как удовлетворять потребности пользователей с помощью технологий и цифр. Мы используем технологию разграничения данных для того, чтобы обслуживать разных пользователей.
Оцифровка – это тенденция, которая обсуждается в «Цифровом выживании», «Бесконтрольном» и «Чего хотят технологии» Кевина Келли. А также это то, что думают атланты современных технологий. Теперь помимо коммерческих, финансовых, сельскохозяйственных, военных и технологических данных, в нашем арсенале появились данные о жизни. Иногда дело доходит даже до того, что данные вызывают тревогу. Например, а что если личные данные будут проданы? Вкратце должны сказать, что данные в глазах искусственного интеллекта не носят личностной окраски. У него нет потребности запоминать ваши пароли и другие сведения в отличие от торговцев данными с низким уровнем образования. Искусственный интеллект сосредоточен на обнаружении общей «модели» из хаотичных действий, оптимизации производства и его обслуживания. Перевод, распознавание речи и распознавание изображений являются лучшими примерами прогресса. Эти данные, через алгоритм распознавания ИИ, будут иметь огромное значение для человечества. Например, от повседневного распознавания речи в борьбе с мошенничеством в сфере финансов до борьбы с терроризмом на национальном уровне.
Технология должна адаптироваться под пользователя, потому как продукт должен отвечать потребностям потребителя. Кажется, что хороший искусственный интеллект должен работать безмолвно и не может допускать скачки напряжения и мутность сведений. Но для того, чтобы улучшить технологии ИИ, нужно оптимизировать детали. Некоторые из них, например технология распознавания речи, работают неплохо, но метод ввода очень далек от того, чтобы называться удобным. Что не может не влиять на восприятие пользователя. Baidu в багаже опыта уже имеет примеры неудачно реализованных продуктов, которые должны быть изменены в соответствии с предпочтениями потребителей.
Данные и технологии не стоят на месте. Они постепенно очеловечиваются и начинают видоизменяться.
Многие интернет-пользователи были впечатлены изображением 1-2. Это Baidu карта с использованием технологии визуализации данных, которая наглядно демонстрирует линии миграции в Китае в начале 2014 года, когда в Дунгуане вышел запрет на порнографию и желтую прессу.
Старший редактор новостей сказал нам, что, рассматривая эту карту, он ощутил себя за пределами обычных новостей. И на мгновение приблизился к пониманию мира. Индекс миграции Baidu отражает перемещения людей с помощью технологии визуализации данных. Миграция людей в цифровую эпоху – это лишь небольшая страница в эпопее миграции людей за миллионы лет. Но эпоха огромных массивов информации тоже имеет свою первую историческую страницу.
Я бы сказал, что это тоже исторический момент в эпоху искусственного интеллекта. Это интеллектуальная картографическая технология для восприятия человеческой деятельности, человеческой судьбы. Искусственный интеллект сам по себе не является гуманным, но в сочетании с творческими идеями разработчиков, философией может обеспечить новую перспективу, даже другое человеческое отношение.
Компьютер и интернет – это тело искусственного интеллекта. А массивы данных или записи человеческой деятельности и человеческой природы могут наконец-то стать его «душой».
Бульвар данных
Один философ сказал, что человек – это существо «в постоянном пути». Baidu накапливает огромное количество картографических данных, дополненных мудростью создателя и различными сложными алгоритмами, которые изображают действия человека и демонстрируют его путь выживания.
Именно наше поколение слушает песню Дуна Ангера: «Ради жизни люди бегают, а их судьбы сплетаются. Я надеюсь, что благодаря искусственному интеллекту траектория движения человечества будет не просто пульсировать, но постоянно пересекаться. Она будет сливаться в одну полноводную реку и длиться бесконечно».
Молодой ученый из лаборатории больших данных Baidu в Принстоне по студенчеству изучал закономерности движения рыб. По возвращении домой он увидел карту миграции Baidu и заметил, что человеческие перемещения очень напоминают перемещения рыб. Изучение человеческих миграций даже более удобно за счет наличия масштабных данных и сведений. Так началась его работа в нашей компании. В 2016 году он и его коллеги использовали данные Baidu о миграции, чтобы предсказать падение продаж iPhone (Apple Phone). Подобный умный подход к анализу стал возможен за счет многочисленных данных, собираемых лабораторией, о разнообразии городской жизни и деятельности производственных предприятий.
В 2014 году Министерство транспорта предложило провести реформу. Было принято решение ускорить развитие программы «четырех перевозок» и строительства, ориентированного на рынок промышленности и научно-исследовательской отрасли. Это стало возможным благодаря технологическим инновациям, которые способны преобразовать научные достижения в производительность транспорта. Сейчас мы сосредоточены на создании многоканальной многорежимной системы и интегрированной платформы информационных услуг в сфере транспорта и путешествий. Она позволит мгновенно публиковать актуальную информацию и решит ряд вопросов человека, который отправляется в очередное путешествие.
В поддержку реформы Baidu выдвинул «интеллектуальный план платформы облачных услуг транспорта Китая». Планировалось совместно с Научно-исследовательским институтом автомобильных дорог Министерства транспорта и Национальным центром интеллектуальных транспортных систем инженерных технологий создать платформу для сотрудничества – эффективную систему обмена информационными ресурсами между провинциями, государственными предприятиями и другими членами общества.
Умная карта может измерить степень затора на дороге, анализируя скорость движения пользователя. И во избежание потери времени сконструировать маршрут объезда пробки. Это стало возможным благодаря использованию технологии виртуальной реальности. На основе данных и с помощью эффективного алгоритма принятия решений карта способна облегчить нагрузку на транспортную систему города и сократить работу для сектора управления дорожным движением.
Современные карты собирают всевозможные географические данные, что позволяет расширить число интеллектуальных проектов. Технология навигации высокой четкости достигает точности до сантиметра. И поэтому была задействована в разработке беспилотных автомобилей. В 2016 году на Всемирном интернет-конгрессе беспилотный автомобиль Baidu был публично протестирован и введен в эксплуатацию в городе Ву. Опыт проходил в условиях движения города. Машина проехала 3,16 километра, 3 светофора и несколько поворотов. Она не только не сталкивалась с людьми, которые перемещались в различных направлениях, но и учитывала погодные условия – дождь, туман, дымку. Полученный результат не уступает успехам коллег из Кремниевой долины, которые проводили подобные испытания в Северной Америке. В рамках разработки беспилотного автомобиля эти успехи незначительны. Но для развития искусственного интеллекта – это внушительный шаг вперед.
ИИ не упал с неба. Ему предшествовали десятилетия работы над компьютерными сетевыми технологиями и технологиями обработки данных, а также сбор необходимой информации о человеческой жизни и деятельности. Baidu Search и Baidu Maps являются материальным результатом процесса развития.
ИИ не миф и не шутка
Сегодня в средствах массовой информации появляется множество новостей о роботах и масса шуток. Например, в недавнем выпуске новостей был сюжет о роботе, который ранит людей. На самом деле это был робот, который упал с платформы. Существует также мнение, что роботы – это игрушки. Но если взглянуть на ситуацию с точки зрения науки, обнаружится, что ИИ – не миф и не шутка. Он – результат человеческого труда. И он не нуждается ни в поклонении, ни в страхе.
Ученые в области искусственного интеллекта часто скромно описывают свои достижения. Ву Цзюнь, бывший инженер Google, рассказывал, что в 2003 году, когда он и его компаньоны работали над повышением точности вводимых ключевых слов в поисковике, основной проблемой стал подбор синонимов для удовлетворения запроса пользователя. Если компьютер не выдает необходимого результата при поиске информации, то человек будет продолжать подбирать ключевые слова. Но в этой ситуации пользователь фактически делает всю работу самостоятельно. Нужно было усовершенствовать технологию, чтобы ускорить процесс поиска и улучшить механизм обратной связи. Инженер сказал: «Может показаться, что у нас нет соответствующих технологий для решения проблемы. На протяжении многих лет пользователи сами подбирали ключевые слова для поиска. Но в 2003 году во время долгих выходных в честь Дня Независимости Соединенных Штатов мы приостановили работу одного из пяти крупнейших центров обработки данных. И за 4 дня сделали обработку каждого ключевого слова. По сути, это был метод исчерпывания. Мы выявили сочетания слов, которые часто использовались для того, чтобы сузить результат поиска. Теперь, когда поступает аналогичный запрос, система дает более точные результаты гораздо быстрее».
Чтобы идти в ногу со стратегией поиска, использующей метод исчерпывания, машинный перевод и другие области технической логики должны иметь сходства. В июне 2016 года на заседании бюро переводов Google активно обсуждалась статья в «Нью-Йорк Таймс», в которой сообщалось о результатах исследований в области машинного перевода, опубликованных Baidu. Высказывание Майка Шустера привело конференц-зал в чувство: «Да, Baidu выпустила новую статью. И такое чувство, что кто-то видит то, что происходит в наших стенах. Потому что все тезисы имеют аналогичную нашим структуру и результат». Баллы BLEU Baidu (оценка качества искуственного перевода в сравнении с человевеческим) в основном совпадали с результатами, достигнутыми Google во внутренних тестах в феврале и марте. Квок Вей Ле, ведущий исследователь Google, не был расстроен. Он пришел к выводу, что исследования двигаются в правильном направлении. «Их система очень похожа на нашу», – прошептал он.
Квок Вей Ле – докторант Ву Энда. И он, вероятно, не знает, что результаты исследований не имеют к профессору никакого отношения и совершенствование перевода осуществлялось независимо. Статья в «Нью-Йорк Таймс», конечно, не получила широкой огласки. Ву Энда считает, что и отечественные СМИ должны изменить свои привычки и перестать подсознательно считать, что новые технологии всегда являются продуктом более сильной зарубежной страны. На самом деле, многие ведущие открытия в области искусственного интеллекта китайцы делают первыми.
Baidu leading выпустила систему перевода на основе NMT. А спустя год, в 2016 году, Google последовал нашему примеру и выпустил аналогичную программу. Таким образом, основные технологии исследователей, которые находятся на передовых позициях в этой сфере, почти всегда одинаковы. Но отметьте, кто накопил и кто оптимизировал данные, чтобы выпустить стоящий продукт.
Сегодняшние идеи ИИ отличаются от прошлых в правилах мышления компьютера при работе с данными и стратегиями решений. В прошлом мы хотели создать идеальную логику для компьютеров, постоянно абстрагируя правила человеческой логики и внедряя их в машины. Сегодня искусственный интеллект основывается на базе данных и алгоритмах. То есть современные достижения ИИ опираются на интернет-достижения конца 1990-х. С интернетом у нас появились необходимые объемы информации. И обратите внимание, эти данные (имя, возраст, адрес, хобби и т. п.) пользователь вводит неосознанно. Они генерируются при использовании интернета. Каждый клик, каждый запрос, каждое перемещение порождают данные.
Китай уже является крупнейшей в мире производственной державой. Теперь нам необходимо расширить влияние «мягкой силы». Дух и культура – это «мягкая сила». Вычисления и данные – это также «мягкая сила». Когда «мягкая сила» накладывается на производственные мощности, рождается сила, называемая «умной». Это скажется на всех сферах нашей жизни.
Должно быть так
У каждого предприятия своя стратегия и тактика. В 2013 году начало подъем отечественное интернет-предпринимательство. Множество бизнесменов вливают огромные средства в эту «бездонную яму», тем самым демонстрируя свою стратегическую храбрость. Baidu сфокусировался на долгосрочной научной стратегии. В то время не многие заметили, что наша компания занялась развитием искусственного интеллекта. А сегодня в мире ИИ часто отмечают твердость и целенаправленность стратегического планирования Baidu. Компания заранее оценивает природу информационной интернет-индустрии и неуклонно двигается вперед, не заботясь о мнении посторонних. Возникновение макета Baidu multipart – это прорыв в сфере искусственного интеллекта. Сейчас направлению ИИ в Китае уделяется большое внимание. Baidu находится на передовых позициях.
Вместо того, чтобы участвовать в развитии таких инструментов, как Go и Predictive Singer, мы сосредоточились на преобразовании искусственного интеллекта в практические средства, которые должны улучшить человеческую жизнь. Мы не только применяем глубокое обучение в таких областях, как распознавание речи, машинный перевод и распознавание номеров домов и улиц, но и успешно используем технологию для того, чтобы усовершенствовать пользовательский опыт.
В 2013 году мы выпустили в мир Baidu Navigator – первый китайский навигатор, доступный для обычных пользователей. Они могут использовать технологии позиционирования и решения от Baidu Maps, чтобы сэкономить значительное количество ресурсов в сравнении с традиционным GPS-трекером. Курьерская компания может использовать программу для планирования оптимального маршрута доставки. У разработчиков игр появилась возможность создавать такие игры, как PokemonGo. Мы открываем Baidu для того, чтобы люди могли использовать его глаза и уши в своих интересах. Мы открываем платформу глубокого обучения PaddlePaddle, чтобы больше людей могли создавать собственные сервисы с функциями ИИ. Мы хотим, чтобы самый неосведомленный в технических новинках и средствах человек научился использовать данные и оптимизировал свою работу, подчеркнул свою индивидуальность и продолжил двигаться к своим мечтам и идеалам.
Многие абитуриенты, кажется, используют приложения-ассистенты для того, чтобы помочь себе выбрать экзамены для поступления в колледж в соответствии с интересами. В Китае многие прибегают к этой технологии. В мои годы учебы люди называли вступительные экзамены «изнурительным мостом». Приложения-ассистенты с технологией глубокого обучения, подобно картографическим данным, реагируют на желания и тревоги кандидатов и стараются дать свой точный ответ. Здесь искусственный интеллект записывает не траекторию движения в физическом пространстве, а психическую траекторию роста студентов.
В начале 1990-х я отправился в Америку изучать компьютерные технологии. В то время многие молодые люди с желанием менять мир с помощью кода путешествовали между Китаем и США, как птицы. Сейчас было бы интересно взглянуть на карту этих трансокеанских перемещений. Теперь, когда ученые, занимающиеся развитием ИИ, вернулись на родину, я думаю, что пламя технологий будущего разгорится с новой силой. Потому что в Китае достаточно необходимого топлива. Огромное количество образованного населения, быстрое распространение компьютеров и мобильных устройств, большое количество данных дают Китаю уникальные преимущества в развитии и применении технологий глубокого обучения. С этими преимуществами мы можем создать легендарное войско исследователей по аналогу Кремниевой долины 90-х.
Baidu должен не просто создать передовую разработку в сфере ИИ. Но и обеспечить функциональную инфраструктуру для перемещения и обработки данных пользователей и платформу для развития технологии глубокого обучения. Мы должны стать сетью для сбора человеческой мудрости.
До того, как Трамп был избран президентом США, более ста человек из числа элиты Кремниевой долины опубликовали открытое письмо. В нем заявлялось, что избрание Трампа будет катастрофой для инноваций. Это затронуло бы и меня, если бы американские инновации действительно пострадали. Кто возьмет флаг, чтобы возглавить инновационное направление? Можем ли мы открыть инновационный центр мира Кремниевой долины для Китая?
Да, к нам стекаются таланты. Baidu основал лабораторию в Кремниевой долине, которая открыла нам доступ к американским талантам. План китайского мозга, предложенный Baidu, сопоставим с любым суперпроектом.
Вспомните, 70 лет тому назад ведущие ученые были полны решимости возвратиться из-за рубежа, чтобы реализовать в Китае грандиозный проект.
Конечно, следует отметить, что великий проект той эпохи опирался на Национальную инвестиционную и промышленную политику. После окончания «холодной войны» конкурентное давление в стране уменьшилось, а инвестиции в передовые технологии значительно сократились. Маск отправился на разработку ракеты, но на самом деле страна передала ему ракетные технологии и команду НАСА. В Китае решимость и правительственные инвестиции по-прежнему сильны. А развитие промышленности концентрируется на сфере искусственного интеллекта. Это лучшая и в то же время самая неопределенная эпоха. Искусственный интеллект – это способ приспособиться к неопределенности. Крупные и малые компании инвестируют в исследования и разработки в области ИИ, чтобы обеспечить конкуренцию и диверсификацию. Они, в свою очередь, должны спровоцировать рост и усиление сотрудничества.
Развитие искусственного интеллекта приведет к неопределенности. Доклад Белого дома уже обращает внимание на влияние искусственного интеллекта на занятость. Стремительное развитие Кремниевой долины в США и упадок Центрального обрабатывающего сектора усилили раскол в стране. Некоторые пользуются достижениями прогресса, другие – выброшены с передовых судов и потеряли направление. Для того, чтобы превратить Baidu в ковчег талантов, нужно мотивировать китайские предприятия к созданию этого ковчега. Важно осознавать, что мы вступаем в новую интеллектуальную эпоху.
Вице-президент Baidu, доктор Ван Хайфэн в ноябре 2016 года был избран членом ACL (Association for Computational Linguistics, International Computing linguistics Society). В настоящее время он является самым молодым членом Ассоциации. Комитет по отбору написал: «Господин Ван достиг выдающихся достижений в области машинного перевода, обработки естественного языка и поисковых технологий в академических и промышленных кругах. А также внес значительный вклад в развитие ACL в Азии». В начале 2017 года известные ученые и руководители в области искусственного интеллекта присоединились к Baidu. Это свидетельствует о тенденции к международной мобильности талантов. Сотни выдающихся ученых, работающих в области искусственного интеллекта в Китае, собираются вместе, чтобы строить будущее человечества.
Будущее пришло: тревоги и мечты
Не так давно появление «бескассового супермаркета» Amazon спровоцировало взрыв в сфере шопинга, или процесса совершения покупок. За опытом Amazon виднеется всего лишь тень «ИИ-кассира». Сегодня обслуживание клиента человеком заменено онлайн-сервисом. Стенографический перевод – распознаванием голоса. Даже кассиры, водители, работники фабрик и юристы заменены искусственным интеллектом. Как люди выживают в этом мире? Как правительства и предприятия должны поддерживать работников? Как мы должны адаптировать экономические, социальные, экологические институты к эпохе ИИ? Мы должны прислушиваться к потребностям обычных людей. И это то, чему наша команда решила посвятить данную книгу.
В Кремниевой долине есть гирлянда с Питером Тилем, сделанная Марком Андерсоном. Он является основателем PayPal, хорошо разбирается в технологии глубокого обучения и часто заслуживает в свой адрес определение – «темная лошадка». В 2016 году он снова оказался в центре внимания за свое точное предсказание, что Трамп будет избран президентом США. В 2011 году он сказал: «Нам нужны летающие автомобили, а вместо этого у нас всего 140 символов». 140-символьный Twitter когда-то был очень веселым, но Питер Тиль ясно видел, чего не хватает. Он критиковал людей за замедление прогресса, за культуру хиппи, за инвестиции в компании со светлыми активами, но без четкого планирования и уверенности в завтрашнем дне. Большинство подобных компаний – мобильные интернет-компании, такие как Airbnb, Uber и т. д. Он считал, что бит-уровень интернет-эры человечества сделал значительный шаг вперед, а атомный уровень практически остановился в развитии. Поэтому он инвестировал в ракеты, препараты для борьбы с онкологией и в искусственный интеллект.
Я также считаю, что суета в интернет-предпринимательстве отдаляет от нас прогресс. Baidu, опираясь на свою долгосрочную стратегию, двигается в выбранном направлении, чтобы внести вклад в развитие человеческих способностей. Господин Тиль говорит, что американцы в начале XX века были готовы пробовать что-то новое и осмелились спланировать и реализовать план покорения Луны. Сейчас у человечества такого плана нет. Мы только всюду ищем добавленную стоимость и сиюминутное удовольствие. Baidu фантазирует об интеллектуальном мире и стремится реализовать его. Мы хотим, чтобы ИИ стал новой операционной системой не только для компьютера, но и для всего мира. При этом не закрываем глаза на все опасности и вызовы и заранее ищем их решения. В конечном итоге мы должны сделать мир другим. Потому что я сказал, что должен сделать это!
Интеллектуальная революция – это добродетельная революция в производстве и образе жизни. Революция в нашем образе мышления. Огромные возможности и проблемы уживаются вместе. Ниже мы рассмотрим все аспекты интеллектуальной революции. Подробно поговорим о визуальном распознавании, распознавании речи, обработке естественного языка и других прорывах, основанных на глубоком обучении. Рассмотрим возможности модернизации производства, беспилотные автомобили, финансовые инновации, интеллектуальную жизнь и многое другое. Мы изобразим предстоящее интеллектуальное общество. А потом вместе с читателями перейдем к обсуждению вопроса о том, как реагировать на развитие ИИ. И все это для того, чтобы ощутить пульс интеллектуальной революции.
Раздел 2. Миссия искусственного интеллекта: «знать больше, делать больше, испытывать больше»
Гипотеза Лу
1980-е годы были идеалистическими годами, когда все жители КНР стремились к научному прогрессу и жаждали знаний. Особенно в кампусах, студенты колледжа учились, как сумасшедшие. Ученые класса Чэнь Цзинжунь стали кумирами многих людей.
В 1987 году в кампусе Фуданьского университета появился молодой человек, который носил очки и был таким же тощим, как Чэнь Цзинжунь[4 - Чэнь Цзинжунь известен тем, что доказал теорему Гольдбаха «1+2». Репортаж Сюй Цзи, «Гольдбаховская гипотеза», был опубликован в первом номере журнала «Народная литература» в январе 1978 года Чэнь Цзинжунем, имя которого в то время стало нарицательным.]. Он был очень энергичным молодым человеком. Каждый день ходил по кампусу с большой сумкой и любил думать и решать сложные задачки. Для окружающих это было непонятно. И в студенческих кругах к нему прицепилась кличка «Чэнь Цзинжунь».
На выпускном он написал напутствие в Памятной книге:
«Я хотел бы представить свои последние исследования, и я хотел бы сказать то, что хотел бы сказать.
«Гипотеза Лу»: HI=>C?HB.
(Где: H: Human I: Intellectualized
C: Computer B: Brain)
Мораль: человек в конечном итоге сделает компьютер умным и сделает его намного лучше человеческого мозга. Возможно, это жемчужина на короне всей компьютерной науки».
Это был Лу Цзи. Он впоследствии работал в Yahoo, стал лидером Microsoft, а сегодня является президентом Baidu Group. «Гипотеза Лу», конечно, не является научной теоремой, как «Гипотеза Чена». Но она и не выдумка. Это больше похоже на будущее озарение. Откуда взялось оно 30 лет назад?
Я хотел бы предложить свои последние результаты исследований и попрощаться с этим классом.
«Гипотеза Лу»: HI => C?HB
(где: H: Человек I: Интеллект C: компьютер B: мозг)
Идея: люди со временем сделают компьютер умным. Умнее, чем человеческий интеллект. Возможно, это жемчужина на короне компьютерной науки.
Речь Лу Цзи о 1984-й годовщине информатики, Университет Фудань
В то время у Лу Цзи было только смутное ощущение: «Компьютеры приносят нам необычайные знания и опыт. Когда мы записывали шахматную программу в компьютерном отделе, которая в сущности была простым кодом, моя интуиция твердила, что нам просто нужно время, чтобы отладить механизм и сделать его умнее, чем люди. Поэтому я и написал то высказывание. А вскоре у меня появилась возможность поступить на компьютерный факультет Университета Карнеги-Меллона».
Личные убеждения Лу Цзи: знать больше, делать больше, испытывать больше.
Когда он окончил университет, он написал «Know more, Do more». А позже добавил – «Know more, Do more, Be more». Потому что чувствовал, что «Be more» важнее, чем все остальное. «Be more» также можно перевести, как «стать лучше». Люди находятся «в пути» и постоянно совершенствуются.
Эти три требования органично связаны друг с другом. И их цель – двигать человечество вперед. Смысл нашего существования заключается в том, чтобы продолжать открывать новые вещи. Чем больше мы знаем, тем больше мы можем сделать. Чем больше мы сделаем, тем больше мы можем испытать. Значит, жизнь будет более насыщенной. Благодаря опыту, накопленному поколениями, мы узнаем, что это продолжительный цикл. И что он является движущей силой человеческого прогресса.
Компьютеры заставляют нас «Know more, Do more, Be more». А искусственный интеллект – последнее эхо этой мелодии. Размышляя подобным образом, мы можем проанализировать то, что люди и организации, заинтересованные в развитии искусственного интеллекта, должны делать. Как искусственный интеллект пришел. Куда идет. Какова его природа и стандарты.
Эра будущего
То, что мы наблюдаем сегодня, – это эра компьютерного и цифрового подъема. Прочный и обязательный процесс в потоке истории человечества. И искусственный интеллект является его движущей силой. Это открывает новую эру, которая принесет долгосрочны революционные изменения в наше общество. Ее последствия связаные с промышленностью, технологиями и другими экономическими и социальными аспектами. Но, в конце концов, революция в искусственном интеллекте позволит нам идти в новом направлении и писать новую историю. Для начала нам нужно понять суть «человеческого прогресса». Мы с энтузиазмом стремимся к тому, что позволяет нам больше познавать, достигать большего и получать больше опыта.
Непрерывное развитие вычислительной мощности, следуя вышеуказанным направлением человеческого прогресса, будет значимым компонентом человеческого прогресса. После изобретения компьютерного программирования прогресс человечества начал ускоряться как никогда. Его модель включает в себя следующие ключевые шаги: человек захватывает различные явления во Вселенной, в частности, через преднамеренное наблюдение, чтобы получить опыт; затем эффективно организует, обрабатывает и уточняет информацию посредством вычислений, которые дают человеку более глубокое и абстрактное понимание того или иного явления, формирующего знания; человек использует знания, полученные в результате познания, чтобы действовать, взаимодействовать с явлениями и в конечном итоге достичь желаемого результата.
В основе современных вычислительных систем и IT-технологий стоимостью в несколько триллионов юаней: информационная организация (IO, способствует познанию), выполнение задач (TC, помогает людям достигать большего), богатый опыт (EE, накапливает опыт). Это три основных измерения человеческого прогресса.
Искусственный интеллект – новые возможности вычислительной мощности человека. И он продолжает способствовать прогрессу. Кроме того, искусственный интеллект – революционная вычислительная система высочайшего уровня (ICS). Это само по себе является беспрецедентным и революционным явлением.
Основной структурой, определяющей современную цифровую вычислительную систему, является организационная форма ресурса. Проще говоря, суть вычислений искусственного интеллекта очень отличается от структуры потока управления фон Неймана, который использует линейную память и булевую функцию в качестве базовой вычислительной операции. Новая парадигма – нейронные сети, характеризующиеся распределенными представлениями и активными моделями. Здесь переменные представлены векторами, наложенными на общие физические ресурсы (например, нейроны), и вычисляются путем активации нейронов. Топологическая архитектура сети и режим активации обеспечивают огромное вычислительное пространство, которое может естественно захватить внушительный объем знаний (через топологию суперпараметров, весов, функций активации). В отличие от локализованного представления в архитектуре фон Неймана (где переменные представлены специализированными или локализованными физическими ресурсами, такими как регистры) и символических вычислений, нейронные сети являются более естественными и мощными в глубоком обучении и представлении физического мира, а также в богатом семантическом знании общества.
Сила вычислений нейронной сети, следующая волна технологии искусственного интеллекта, может поднять текущую вычислительную систему в двух измерениях:
Первое – автоматическая иерархическая функция / представление обучения. Это существенное увеличение возможностей машинного обучения, так как большая часть сегодняшней работы машинного обучения является ключом к характерной инженерии. Например, мозг Baidu уже имеет триллионы параметров, сотни миллиардов образцов и сотни миллиардов характеристик обучения.
Второе – продвинутая когнитивная, особенно перцептивная способность. Это огромный катализатор для устройств следующего поколения (например, беспилотных автомобилей) и платформ следующего поколения (например, сеансов естественного языка).
Мощные вычислительные возможности искусственного интеллекта помогут создать множество новых разновидностей интеллектуальных систем, таких как машинные юристы, машинные аналитики, медицинские роботы, интеллектуальные агенты по обслуживанию клиентов и т. д.
Еще одним направлением развития искусственного интеллекта является организация различных систем, обслуживающих определенную физическую архитектуру и физические элементы, такие как дома, офисы, заводы и другие интеллектуальные системы. Его основная модель заключается в том, что «система восприятия» искусственного интеллекта распознает и воспринимает физическую архитектуру с помощью различных примитивных сигналов от датчиков интернет-вещей; в то время как «когнитивная система» требует организации информации и изучения большего количества знаний о физической архитектуре, а также прогнозирования, оценки и принятия решений, чтобы сделать различные физические системы более интеллектуальными.
В настоящее время в области научных исследований, искусственный интеллект может обеспечить более продвинутые возможности моделирования, стать катализатором для новой волны научных исследований во многих отраслях.
В сфере бизнеса искусственный интеллект – это дополнительные возможности для создания интегрированной платформы вычислительных систем (BCS) для корпораций. Например, запись бизнес-объектов (модели проектирования системы, транзакции) и бизнес-процессов (ERP (планирование ресурсов предприятия), CRM (управление взаимоотношениями с клиентами)); или проектирование системы и имитация деятельности человека, такой как общение, сотрудничество, чтение, письмо, поиск информации и т. д.
В настоящее время искусственный интеллект «системы восприятия» имеет более широкие возможности для бизнеса: с одной стороны, вы можете построить и развернуть «системы зондирования» для физической среды или физических систем, таких как сборочные конвейеры, заводы и так далее. Это позволяет будущему трудоемкому производству, бизнес-услугам и т. д. использовать более продвинутые информационные инструменты и более сильную автоматизацию. С другой стороны, быстрый прогресс в технологии обработки естественного языка позволяет нам сканировать и анализировать текстовые документы и информацию, а также извлекать из них различные ценные бизнес-знания. Создание и развертывание специальных «подсистем понимания текста» может дать много ценной информации и результатов.
«Когнитивная система» искусственного интеллекта представляет собой интеллектуальную эру в долгосрочной перспективе. В будущем будут реконструированы все отрасли, профессии, социальные системы и даже образ жизни. Если цифровое общество мы можем определить как эру «информации на кончиках пальцев», то эра искусственного интеллекта – это «повсеместное знание, где каждое действие является интеллектуальным».
Несомненно, новая эпоха ИИ предоставит человечеству колоссальное количество возможностей.
Хорошие новости для бизнеса – появится много возможностей для продвижения, преобразования и перехода на новые ступеньки роста. Но есть и плохие. Никто не сможет оставаться в стороне. Если вы не двигаетесь вперед, то неизбежно отстанете и будете выброшены за борт.
Предпринимателям достаточно взглянуть на список «рыночных возможностей» и найти там бесконечное число идей для строительства будущих бизнес-империй. Нужно только смотреть вперед с учетом нового духа интеллектуальных предпринимательских возможностей. Сегодняшние руководители предприятий должны шагать в ногу со временем и соответствовать «интеллектуальному возрасту».
Инвесторы также смогут открыть для себя эру нового бизнеса. Поддержите начинающих, чтобы впоследствии вырасти в крупную бизнес-корпорацию, и получите значительную отдачу.
Для страны или правительства каждая технологическая революция сопровождается чередованием взлетов и падений общественных настроений. Всегда найдутся те, кто воспользуется возможностью, предоставленной историей. Они сделают широкий шаг вперед и выиграют благополучие и процветание для своей страны. Для того, чтобы воспользоваться историческим шансом, крайне важно принимать дальновидные политические решения, решительно вкладывать инвестиции в стратегически важные сферы и отрасли и способствовать развитию науки.
Но, конечно, большой поток людей и предпринимателей, влившихся в сферу ИИ, неизбежно спровоцирует хаос.
В Кремниевой долине делают ставки на инвестиции в AI + X. Например, существует инвестиционная компания, специализирующаяся на искусственном интеллекте. Один из партнеров (LP), бывший мэр города Нью-Йорк Блумберг, наблюдает за сотнями компаний. Большинство из них стартапы, которые утверждают, что работают в сфере ИИ. Главный вопрос инвестиционной компании – как определить, куда инвестировать, чтобы вложить деньги эффективно. Это побудило нас задуматься: каковы критерии компаний сферы ИИ? Какие из компаний настоящие, а какие нет?
Критерии измерения искусственного интеллекта
Появление каждой новой технологии в истории человечества неизбежно будет сопровождаться размышлениями, дискуссиями и противоречиями. Перед лицом подъема искусственного интеллекта с революционными и глобальными изменениями в сфере технологий волнение, вопросы и проблемы крайне разнообразны. Некоторые из них более эмоциональны. Например, обсуждают, может ли искусственный интеллект заменить человека. Речь идет о сравнении искусственного интеллекта с природным (Natural Intelligence).
По вопросу природного интеллекта существуют различные исследования и труды, в том числе и те, которые предполагают, что механизм человеческого мозга опирается на квантовые вычисления. Для искусственного интеллекта нет четкого определения, которое бы не вызывало споров. На данном этапе развития ИИ нет необходимости усердствовать над критериями оценки. Мы могли бы обсудить это прагматично: какие интеллектуальные системы теперь могут позволить нам сделать технологии.
Существует два типа вычислительных систем, которые люди называют искусственным интеллектом.
Первый эквивалентен подсистеме «интеллектуальных вычислительных систем» (ICS). Он использует информацию в качестве входных данных и на ее основе моделирует явления, которые нас интересуют. Мы называем этот тип системы ИИ «универсальной интеллектуальной системой» (General AI). Название говорит о том, что машина обладает способностью получать знания и достигать поставленных целей.
Второй – это машины с когнитивными способностями, которые подобны человеческим. Машины могут «видеть», «слушать», «чувствовать», могут все больше рассуждать и планировать, могут двигаться благодаря сенсорному управлению движения. Мы называем этот тип системы искусственного интеллекта «когнитивной интеллектуальной системой» (когнитивный AI). Это машина со способностями восприятия, рассуждения, планирования и сенсорным управлением движения.
К другой классификации системы искусственного интеллекта относятся «узкий ИИ» и «Общий AI». «Общий AI» – это система, которая использует один и тот же алгоритм для решения большого класса задач. Система «обобщенного ИИ» может быть изучена и адаптирована для решения новых задач без вмешательства человека. Система «узкий AI» использует определенный алгоритм для решения конкретных задач, таких как игра в шахматы, создание карт и т. д.
Таблица 2-1 представляет собой обзор состояния системы искусственного интеллекта. И может служить жизнеспособным определением.
Таблица 2-1
Интеллектуальные вычислительные системы напрямую связаны с большими данными. Любые данные имеют критерии, по которым они генерируются. В основе данных лежит знание.
Основная компетенция универсальной системы искусственного интеллекта заключается в извлечении знаний из данных с помощью алгоритмов и вычислительных систем. После того, как мы получим знания, мы можем сделать множество вещей. Мы можем предсказывать явления и события, можем решить проблему автоматизации, можем решить любую проблему, которая нуждается в решении. Знание говорит нам, чего хотят люди, чего требует общество. Со знанием мы можем найти ответ. Таким образом, первый уровень развития искусственного интеллекта – общий искусственный интеллект.
Прорыв в глубоком обучении, достигнутый в последние годы, касается уровня восприятия. В частности, распознавания изображений и речи, а также понимания естественного языка. Но это только начало. Следующее, что нужно сделать, это добавить познавательную функцию. Система должна научиться познавать окружающий мир через свет, вибрацию звука или язык общения и символы.[5 - За последние несколько лет нейросети научились понимать, что за объекты находятся на фотографии и как они взаимойдействуют друг с другом. Например, чашка стоит на столе, а ложка находится внутри чашки. В экспериментальных сетях достигнут и обратный эффект: по текстовому описанию нейросеть способна воссоздать изображение, например женщину, едущую на лошади по лугу. – Прим. науч. ред.] Самое главное – понять, что это значит. Система видит перед собой картину и может определить, какие объекты или люди в ней находятся и что делают.
В настоящее время почти все компании, которые занимаются разработкой ИИ, могут быть размещены в четырех квадрантах. Большинство компаний создают «узкий AI», который решает только одну проблему или несколько относительно узких: играть в карты или открыть автомобиль. «Общий ИИ» использует одну и ту же систему, для решения всех проблем. И это уже похоже на человеческий интеллект. «Общий ИИ» – это долгосрочная цель развития искусственного интеллекта, достижение которой займет не менее двадцати-тридцати лет. Baidu, Google, Microsoft, Facebook и другие компании работают в направлении «общего AI». И они способны судить, может ли человек с помощью искусственного интеллекта знать больше, делать больше, испытывать больше. Например, компания Baidu, опираясь на данные поисковых систем, провела большое количество технических исследований, прежде чем создать практически невозможное – продукт, который опирается на мнения людей. Мы нашли множество беспрецедентных знаний и сделали множество выводов. Благодаря этому сейчас люди знают больше. Но мы не остановились и продолжаем двигаться вперед, чтобы добиться более невозможного. Беспилотные технологии управления, технологии взаимодействия на естественном языке, сенсорные методы движения постоянно совершенствуются. Сейчас люди используют глаза, чтобы видеть, и уши, чтобы слышать. Но, возможно, в будущем нам не понадобятся ни глаза, ни уши, потому что у нас появится более совершенный способ восприятия реальности.
Таким образом, все компании в сфере ИИ можно оценить по нескольким вопросам: Какой из четырех квадрантов занимает компания? Есть ли у нее силы и средства, чтобы люди с машинами знали больше, делали больше, испытывали больше?
В США и Китае существует множество компаний, которые утверждают, что они занимаются развитием искусственного интеллекта. Некоторые из них говорят, что ИИ – это облачные вычисления. Другие, что ИИ – это большие данные. Но это лишь часть системы искусственного интеллекта. Сила искусственного интеллекта – это массивы данных, облачные вычисления, алгоритмы, время обучения и общая мощность, а также программное и аппаратное обеспечение.
Такую силу невозможно собрать в одночасье. И не имеет смысла обобщать. На Земле нет одной дороги. Есть разные пути. Есть разные сайты, люди, бизнесы. Кто-то из них только начал движение, а кто-то оставил за спиной уже внушительную часть пути.
Baidu Brain можно рассматривать как типичную силу искусственного интеллекта. Его способность к разделению может подчеркнуть нашу состоятельность в индустрии искусственного интеллекта. Если у компании, специализирующейся на продуктах с ИИ, нет возможностей в будущем, можно сказать, что она не готова войти в эту сферу.
Baidu Brain – это сочетание аппаратной базы, базы данных и алгоритмических возможностей, облачных вычислений, больших данных и искусственного интеллекта. Это сочетание является основой стратегии Baidu. Облачные вычисления – это инфраструктура. Массивы данных – это топливо. Искусственный интеллект – это двигатель, объединяющий «физику интернета», интернет-технологии и бизнес-модели цифрового мира. Он входит в общество, чтобы полностью его изменить.
Облачные вычисления, имя в облаке – это нижняя составляющая мозга Baidu, физическая его часть IaaS (Infrastructure as a Service, инфраструктурные услуги).
Супервычислительная мощность Baidu Brain достигается за счет высокопроизводительного вычислительного оборудования. Оно составляет сотни тысяч серверов и использует передовые кластерные операционные системы для унифицированного управления суперкомпьютерами ИИ.
Для того, чтобы расширить возможности обучения, Baidu самостоятельно разработал GPU и FPGA (Программируемая пользователем вентильная матрица) гетерогенный вычислительный сервер. Он был увеличен до 64 GPU / FPGA и превосходит традиционную плотность сервера в 16 раз. Один сервер теперь может завершить обучение 100 миллиардов моделей данных. В основе Baidu FPGA находится процессор, обеспечивающий 10 Tops[6 - Триллион операций в секунду – Прим. науч. ред.] вычислительной производительности. Он превосходит основной 20-ядерный сервер по вычислительной эффективности в 60 раз.
Но преимущество Baidu не только в одной машине, но и в отличной системе, отличной индивидуальной интеграции. Это формирует широкий спектр возможностей. Интеллектуальное планирование и система управления ресурсами для кластеров GPU позволяют осуществлять управление и динамическое планирование вычислительных, сетевых пулов, а также ресурсов хранения, вычислять общую эффективность и среднее использование кластера на 80 %. Гетерогенное оборудование для онлайн-продуктов, уменьшающее задержки запросов пользователей в 5 раз, повышает эффективность вычислений в десятки раз.
Система представляет собой самый большой кластер GPU/FPGA в Китае, самый большой кластер HADOOP/SPARK – новая одновременная и самая эффективная технология обработки данных (новые вычислительные технологии, серверные технологии, технология доступа 100G RDMA (дистанционная мгновенная технология доступа к данным) и технология O&M). Она обеспечивает вычислительную мощность, необходимую для развития искусственного интеллекта.
Топлива тоже достаточно. За годы работы в сфере ИИ компания Baidu собрала большое количество данных: триллион данных по страницам, миллиарды данных поисковой системы, 10 миллиардов видео, 10 миллиардов изображений и аудиоданных. Данные – это топливо для алгоритмов искусственного интеллекта. Это одно из основных условий развития искусственного интеллекта.
Оборудование в сочетании с топливом является отличным алгоритмом и моделью развития. Baidu собрал команду ведущих мировых ученых и инженеров, специализирующихся на теории и практике непрерывных инноваций, построил крупнейшую в мире глубокую нейронную сеть, поддерживающую триллионы параметров, сотни миллиардов образцов, сотни миллиардов характеристик обучения. Глубина нейронной сети значительно превысила 100 слоев.
Аппаратные мощности, топливо из данных и душа, алгоритм, позволили создать Baidu PaaS (Platform as a Service). Отличительной особенностью Baidu PaaS является то, что ИИ – горизонтальный сервис для всей платформы. Глубокое обучение, технологии машинного обучения в сочетании с мощными вычислениями, массивные данные и отличные алгоритмы, голос, изображения, обработка естественного языка и другие аспекты создают уникальные возможности для разработки карт знаний, портретов пользователей и бизнес-логики. Кроме того, они полностью открыты для пользователей. Пользователи могут легко использовать различные модули алгоритма, инструменты разработки, данные для своих собственных бизнес-целей. Мы используем различные платформы для разных целей: Tianji – для интеллектуальных массивов данных, Tianxiang – интеллектуальных мультимедиа, Tiangong – интеллектуальных вещей. Так, у нас есть возможность оказывать услуги во всех трех областях.
На верхнем уровне SaaS (Software as a Service) искусственный интеллект Baidu используется для принятия вертикальных решений, проникающих во все отрасли. Мы стремимся работать с нашими партнерами над созданием интеллектуальной индустриальной экосистемы, куда войдут образовательное облако, финансовое облако, транспортное облако, логистическое облако и т. д. Мы считаем, что способность строить экологию интеллектуальной промышленности – важный критерий для определения ценности искусственного интеллекта.
В аппаратных мощностях, данных и алгоритмах есть один важный пункт – культура искусственного интеллекта, или «мягкая сила». Технология поиска стала пионером в сфере искусственного интеллекта и первым интернет-порталом цифрового мира. Процесс разработки и технологическое ядро поисковой системы заложили основу для будущего ИИ. Поисковые системы, во-первых, должны были иметь дело с очень большими объемами данных. Во-вторых, должны были обладать функциями глубокого обучения. Операции невозможно совершать вручную, так как объем данных был и остается слишком велик. И, наконец, ключевой момент. Процесс разработки поисковых систем согласуется с развитием систем искусственного интеллекта, в основном с данными, которые представляют ценность для пользователя. Отношения сотрудничества, деловые возможности и рабочие привычки, массивы данных и накопление корпоративной культуры людей из бизнеса поисковых систем очень схожи с бизнесом ИИ. Так Лу Цзи всегда начинал обучать новичков с Bing. Справился там, справишься и в любом другом секторе. В поиске используются очень простые методы. Конечно, культура еще не идеальна. Но она, как и нейронные сети, может развиваться и совершенствоваться при правильном подходе.
Искусственный интеллект + мир
Раньше люди активно обсуждали плюсы интернета. А теперь переключились на плюсы искусственного интеллекта в бизнесе, промышленности, здравоохранении, образовании и так далее. С точки зрения «знай больше, делай больше, испытывай больше», ИИ для мира будущего является фундаментальным явлением. Так появился вопрос – «искусственный интеллект + мир».
Во-первых, интеллектуальная революция может иметь далеко идущие последствия для повседневной жизни каждого человека. Самый простой пример – благодаря новаторским разработкам в области искусственного интеллекта, калькулятор и человек смогут разговаривать на одном языке.
Предыдущие взаимодействия человека и машины происходили через мышь и клавиатуру. Развитие Майкрософт позволило усовершенствовать способ коммуникации. Сегодня мы общаемся через мышь, клавиатуру и GUI (графический интерфейс пользователя), что называется рациональным взаимодействием человека и компьютера. Самый большой вклад компании Apple и Стива Джобса в развитие IT-технологий – это новый способ общения с машинами с помощью пальцев, который изменил мир. В эру искусственного интеллекта мир постоянно меняется. Теперь люди могут общаться с любым устройством на естественном языке.
Естественный язык является наиболее эффективной и универсальной формой общения. Общение между людьми – это язык, самый естественный и широко используемый. Реализация взаимодействия между человеком и компьютером на естественном языке означает, что людям не нужно будет разбираться в принципах работы каждого приложения и устройства, чтобы узнать, как им пользоваться. В будущем мы сможем общаться с автомобилями и домами напрямую.
Мы уже видели зачатки этого интеллектуального взаимодействия. Например, постепенно появляются некоторые интеллектуальные вспомогательные системы. В Соединенных Штатах люди с помощью Amazon превращают дом в умную систему. В Китае команда Baidu тоже провела много исследований в этой области. У нас есть возможность полностью изменить повседневный процесс взаимодействия людей друг с другом.
Наконец, искусственный интеллект станет двигателем новой промышленной революции. Многие люди задумываются о новой версии промышленного производства 4.0. Вступит ли мир в следующий этап цифрового общества? Интеллектуальные системы будут иметь возможность черпать данные из реальной жизни, перемещаться по знаниям. Этим они помогут людям воспринимать и познавать реальный мир. И внедрять изменения в экономические, социальные, культурные и другие аспекты жизни. Нам повезло жить в увлекательной эре, очень похожей на раннюю промышленную революцию. Но искусственный интеллект имеет гораздо большее влияние на общество.
Традиционная обрабатывающая промышленность (оборудование, электроприборы и электроэнергетика, производственные линии) использует очень крупные инвестиции для создания продукта, изменение которого вызывает известные сложности. Например, чтобы создать производственную линию автомобилей, потребуется внушительное количество времени и средств. Умные данные смогут точно предсказать конец завершения преобразования обрабатывающей промышленности и создать новую модель производства. Производство будущего – модульный процесс с цифровым управлением. Если автопроизводитель захочет создать новый тип автомобиля, ему не потребуется перестраивать производственные линии. Нужно будет всего лишь изменить интерфейс (API) для нового продукта и перейти на него. Это в корне изменит производственную базу и значительно улучшит эффективность производства.
В основе этого изменения лежат данные и знания, а именно знание процесса производства. Теперь каждый шаг можно будет контролировать с помощью цифровых технологий.
Приведем пример из фармацевтической промышленности. Создание нового лекарственного препарата – это длительный процесс исследований и разработок, чтобы выявить наиболее эффективный способ для борьбы с конкретным заболеванием. В будущем с помощью вычислительных технологий искусственного интеллекта, больших генетических данных и массивного анализа информации о здоровье человека индивидуальный подбор лекарств будет осуществляться в считанные минуты.
Рис. 2-1 Стремительный рост геномных данных[7 - Великобритания запустила «геномную программу 100 000 человек» в 2014 году, а США и Китай объявили о завершении сбора геномных данных до 1 миллиона человек. Данные, полученные всемирно известной компанией по секвенированию генов Illumina Instruments sequencing, удваиваются каждые 12 месяцев. Это огромная «черная дыра данных», а также золотодобывающая шахта данных.]
Искусственный интеллект не только повышает общую конкурентоспособность Китая на мировой арене, но и дает ему существенные преимущества. КНР – крупный игрок в обрабатывающей промышленности, где объем данных имеет большое значение. Это означает, что у нас есть возможность извлечь больше «знаний» и получить лучший результат, чем у других. Вы знаете больше, чем кто-либо другой. Видите больше, чем кто-либо другой. Можете сделать больше, чем кто-либо другой. Вы сильнее, чем кто-либо другой. Интеллектуальная эпоха, национальная конкуренция, промышленная конкуренция, овладение большими объемами информации может сделать тебя непобедимым. Если бы Китай воспользовался этой возможностью и завершил интеллектуальную модернизацию, другие страны не смогли бы с ним конкурировать. Но то, как достичь умного производства, требует общего стратегического анализа.
Преимущества Китая
В настоящее время США и Китай являются двумя крупнейшими странами с точки зрения искусственного интеллекта.
Люди привыкли сравнивать Baidu и Google, что также можно рассматривать как уменьшенную копию сравнения США с Китаем. Я думаю, что у обеих компаний есть много общего – происхождение, корпоративная культура. Baidu имеет преимущество в Китае, а Google – в США.
Но есть и отличия. У Baidu больше пространства для инноваций и выше их скорость, чем у Google. Это связано с национальными условиями Китая и США.
Уровень инноваций мобильного интернета в Китае на многих уровнях превзошел уровень инноваций в США.
Например, создание инновационного мобильного телефона с функциями искусственного интеллекта для поиска информации. Baidu имеет больше возможностей для инноваций, чем Google. IT-отрасли в США и Китае имеют разные модели. Baidu Financial может опираться на преимущества китайского рынка и объемы данных и, используя технологию ИИ, создать нечто революционное. В Соединенных Штатов финансовая индустрия имеет «сильные барьеры», поэтому Google попасть в финансовый сектор проблематично.
Другой пример – беспилотные автомобили. Google и Baidu пионеры в этом направлении. Сейчас Google немного обогнал Baidu. Но не факт, что это будет долго длиться. Сегодня множество китайских автопроизводителей открыты для сотрудничества с предприятиями ИИ, в частности с Baidu. Вместе у нас очень много возможностей для нововведений. И скорость таких нововведений будет значительно быстрее, чем у США. В Америке большинство автопроизводителей располагаются в Детройте, поэтому им сложно наладить коммуникацию с компаниями в сфере ИИ.
Беспилотный ли это автомобиль, финансы, здравоохранение или производство вообще, Китай и Соединенные Штаты смотрят на будущее под одним углом. Тем не менее макросреда в Китае дает умным компаниям, как Baidu, больше возможностей и пространства для действий, чем США для Google.
Итак, какую же ответственность должна взять на себя компания Baidu в условиях новой эры искусственного интеллекта?
В Соединенных Штатах система IT-индустрии, как правило, зависит от пяти компаний: Apple, Google, Facebook, Amazon, Microsoft. Компания, поддерживающая ИИ, – это не просто производственная компания. Это компания, которая управляет развитием технологий и играет роль лидера экосистемы.
В эпоху искусственного интеллекта Baidu является компанией поддержки. У нас есть такая возможность. Поэтому мы должны продолжать бороться за интеллектуальную революцию в Китае и в мире и внести свой вклад в это непростое дело.
Чтобы стать первопроходцами и основателями, мы должны позиционировать себя как «наделенные полномочиями». Baidu – это, прежде всего, китайский мозг Baidu. Интеллектуальное облако Baidu доступно для всех отраслей промышленности и для любой открывает широкие возможности для движения вперед.
Как основоположник отечественного искусственного интеллекта, Baidu имеет влияние на развитие и совершенствование во многих отраслях сферы искусственного интеллекта.
Например, здравоохранение и образование – очень большая область применения ИИ. Здесь особенно ярко наблюдается проблема недостатка данных. Знания и опыт могут быть только приобретены и накоплены. Поэтому высокую квалификацию имеют старые учителя и врачи. В будущем с помощью машин мы сможем автоматически анализировать данные, помогая тем самым врачам упростить подбор медикаментов, а учителям найти индивидуальный подход к каждому ученику. Здравоохранение станет давать людям больше здоровья, а образование – знаний. В обеих областях применение ИИ будет играть существенную роль.
Или беспилотные автомобили, например. Создание дронов также опирается на восприятие, познание и знание. Сегодня введение беспилотных автомобилей в эксплуатацию еще не представляется возможным и требует времени[8 - Несмотря на возросшую активность за последние годы, даже передовые проекты с беспилотными такси не допускают перемещение авто по городу без оператора внутри, пусть и не на водительском кресле. – Прим. науч. ред.]. Но как только мы этого достигнем, у общества откроются огромные перспективы для трансформации. Это не просто решение транспортной проблемы. Беспилотная машина может двигаться сама по себе. И это скажется во всех отраслях промышленности.
Искусственный интеллект предоставляет нам такое количество возможностей, что реализовать их все и сразу не представляется возможным. Конечно, стратегия трансформации общества должна реализовываться шаг за шагом. Направление движения должно быть твердым, а темп устойчивым.
Бизнес-вызов: приземление
Однажды Лу Цзичанг сказал: «Голову держи над облаками, но ногами стой на земле». Это значит, что вы должны держать голову выше, чтобы видеть далеко и ясно, но ноги должны ступать по земле, чтобы шаг за шагом двигаться вперед.
Первое, что мы должны сделать, чтобы дать искусственному интеллекту жизнь, – приземлиться. ИИ сулит нам очень большие и долгие изменения. Для приземления потребуется хороший пользовательский опыт получения реальной выгоды. Также потребуется понятный сценарий – интеллектуальный помощник или беспилотный автомобиль должны иметь достаточно информации о людях, чтобы иметь для них ценность. И, наконец, нужна эффективная бизнес-модель, чтобы добиться устойчивости.
Таким образом, задача заключается в том, чтобы преобразовать пользовательский опыт в пользовательскую ценность, а затем подобрать бизнес-модель для создания инновационного цикла: данные – знание – опыт – новые данные. Попав в такой цикл, ИИ сможет продвигаться вперед стремительно, как снежный ком.
Рис. 2-2. Инновационный «маховик» искусственного интеллекта
Генеральный директор (CEO) каждой компании должен обратить внимание на искусственный интеллект. Затем необходимо найти ресурсы, в том числе нанять тех людей, которые действительно разбираются в ИИ, и тех, которые могут взять на себя ответственность за принятие решений. Компаниям, будь то розничная торговля, обрабатывающая промышленность или туризм, следует разработать собственную интеллектуальную стратегию в соответствии с их бизнес-целями, а затем твердо ей следовать. При этом у исполнителей должны быть достаточные полномочия, чтобы посредством стратегического их разделения внедрять ИИ в конкретные операции.
Модель «рабочего двигателя» может использоваться для реализации стратегии ИИ.
Во-первых, в соответствии с направлением развития искусственного интеллекта следует переосмыслить позиционирование предприятия – ориентируясь на свои бизнес-цели, выбрать новое направление развития, определить новую миссию и видение в эпоху ИИ.
Во-вторых, в соответствии с новым позиционированием предприятия разработать интеллектуальную стратегию. Это возлагает на руководство компании большую ответственность. Оно должно четко понимать, «что входит» в сферу, а «что выходит», чтобы принимать эффективные решения.
При принятии решений о «входе/выходе» следует придерживаться определенных принципов. Иерархическая структура принятия решения консультанта Кремниевой долины Джеффри Мура (Jeffrey Moore) – хороший пример оценки развития искусственного интеллекта. Суть в том, чтобы войти в сферу с высоким ростом и выйти из сферы с низким. Искусственный интеллект будет постоянно создавать новые сферы с огромным потенциалом роста, такие как беспилотные автомобили, роботы, умные устройства, диалоговые системы. Но в то же время он может и чинить препятствия для некоторых отраслей. Новые продукты с функциями ИИ заменят уже имеющиеся. Новые аппаратные средства и программные стеки нанесут ущерб старым стекам HW. Хорошей идеей будет составить полный список сфер и категорий высокого роста, возможного роста и низкого. Так руководство сможет принимать систематические и взвешенные решения.
Далее следует определить исходные данные продукта. Является ли он «ценным и уникальным»? Стоит отметить, что в эпоху ИИ успех продукта будет во многом зависеть от способности компании сохранять свою индивидуальность. Только так возможно получить уникальные активы данных (приносящие уникальные знания).
Следующий шаг – понимание неопределенности, риска, прибыли и графика для прогнозирования и управления. «Модель горизонта» – оптимальное решение. Примерный план развития: период H1 (следующие 18 месяцев) – упор делается на основное направление бизнеса; период H2 (следующие 18-36 месяцев) – инвестирует в создание прибыльной инновации; период H3 (следующие 36 месяцев+) – ставки делаются на долгосрочные инновации, которые имеют большой потенциал и высокий риск. Эра искусственного интеллекта предлагает широкий ассортимент возможностей для периодов H2 и H3. А некоторые из инвестиций в ИИ могут помочь увеличить прибыль и от периода H1. Сейчас искусственный интеллект находится на ранней стадии своего развития, что порождает множество неизвестных. Для того, чтобы глубже понять ИИ, важно принимать принципиальные и прагматические решения.
Во-первых, на этапе реализации стратегии внедрения ИИ предприятию следует придерживаться принципа «структурной целостности» в опыте продукта, технологической архитектуре и бизнес-модели. Необходимо развиваться последовательно. Если вы меняете направление ICS (архитектура сервера/клиента) или инвестируете в «автономную систему», технологические решения должны быть синхронизированы с продуктами и бизнес-решениями.
Во-вторых, важно, чтобы предприятия, использующие ИИ, следовали за направлением развития технологии глубокого обучения. Синхронизация имеет большое значение.
Ведущие компании индустрии испытывают потребность в изменении мира, стремятся сформировать мировоззрение мирового технологического общества. Они собирают сильные научно-исследовательские группы и проводят масштабные исследования. Их цели соответствуют позиционированию компаний и совершенствованию их продуктов. DeepMind, Google, Baidu и некоторые другие гиганты отрасли разделяют эту позицию.
Обновление исследовательских механизмов также является важным шагом на пути развития. Ведь традиционно ИТ-индустрия и наука не очень успешны в коммерциализации результатов исследований. Недавние OtherLab или OpenAI и некоторые другие стартапы искусственного интеллекта активно набирают собственные исследовательские команды. И это превращается в тенденцию. Потому что для разработки структурированных и устойчивых решений требуются усилия различных организаций (ранние экосистемы, крупные предприятия, учебные и научно-исследовательские учреждения).
Инвестиции являются важным фактором, который необходимо учитывать. С углублением интеллектуальной революции, ожесточается борьба за таланты. Это приводит к росту стоимости искусственного интеллекта. Некоторые стартапы привлекают внушительные суммы денег, потому что в долгосрочной перспективе отдача от инвестиций может быть очень велика (высокий риск/высокая отдача). Ключ к планированию инвестиций заключается в приоритезации ресурсов и продуманном процессе принятия решений, отражающем риски, связанные с искусственным интеллектом.
После того, как все необходимые условия сойдутся, лидерские качества человека станут решающим фактором, ценнейшим и перспективнейшим. Эпоха ИИ базируется на технологии, которая абсолютно не похожа на предыдущую (в качестве ядра выступают нейронные вычисления). Поэтому она требует от руководства высокого внимания и ответственности. Кроме того, новые отрасли в сфере ИИ настолько разнообразны и междисциплинарны (все, что вы можете себе представить от генетики до робототехники), что компаниям требуются люди, способные работать с инновациями (найти их непросто, потому что сегодняшнее общество сосредоточено на развитии узкоспециализированных отраслей). Билл Бакстон, главный научный сотрудник Microsoft Research, предлагает эффективные решения для создания новаторской команды высшего руководства.
Стоит напомнить, что в основе инновационного «маховика» ИИ лежит цикл обратной связи: данные – знания – опыт – новые данные. Оптимизация емкости и скорости этого цикла обратной связи является важной составляющей планирования.
Необходимая макросреда
Предприятия и научно-исследовательские институты не могут работать без хорошей макросреды. Национальный китайский интеллектуальный план призывает к созданию интеллектуальной инфраструктуры на уровне страны. Ведь чтобы встретить эру искусственного интеллекта, необходимо создать надлежащую почву.
Во-первых, необходимо обеспечить беспрепятственный доступ к данным. Данные становятся стратегическим активом для многих организаций и могут рассматриваться как новый тип «природных ресурсов». Для правительств, в частности, данные могут быть полезны в процессе разработки стратегии политического управления. Это может послужить стимулом для более широкого внедрения инноваций.
Во-вторых, нужны инструменты и платформы с открытым исходным кодом. Эра искусственного интеллекта требует нового стека программного обеспечения Silicon+. При этом важно, чтобы инструменты и платформы с открытым исходным кодом, такие как PaddlePaddle, были доступны и разработчикам, и новаторам. Глядя в будущее, мы должны постоянно снижать степень участия человека в процессах и передавать задачи инструментам и модулям. Например, AWS (Amazon Cloud Service) делает проще вычисления, а некоторые AI-as-a-service (AI-Service) делают технологии ИИ более доступными.
В-третьих, новаторы должны быстро создавать рыночные и политические условия для своих продуктов и пользователей. Это также очень важно. Потому что инновационный «маховик» ИИ требует быстрого цикла обратной связи.
В-четвертых, в начале эпохи искусственного интеллекта поощряются непрерывные прикладные исследования. В частности, разработка ML-алгоритма (машинного обучения), который может получать знания из данных и создавать опыт – ядро инновационного «маховика». На данном этапе развития ИИ непрерывные исследования – важная составляющая деятельности для всех предприятий этой сферы.
В-пятых, следует озаботиться образованием. Требования ИИ к человечеству неизбежно приведут к проблеме нехватки талантов. Образование должно стать обширнее и качественнее для того, чтобы для проектирования и реализации алгоритмов машинного обучения хватало человеческого ресурса.
Наконец, должен быть сформирован новый структурированный подход, превращающий знания внешнего мира в организованный и доступный материал. Это имеет решающее значение для внедрения инноваций ИИ во многие компании и сферы жизни.
Культура и управление интеллектуальным обществом
Потребуются десятилетия, чтобы искусственный интеллект начал полноценно функционировать. Амбиции и претензии на изменения мира требуют долгосрочного инвестирования. Поэтому долгосрочное планирование и стратегическое управление играют важную роль в эпоху искусственного интеллекта. Нас ожидает трансформация культуры бизнеса и управления во всем мире.
В частности, это требует, чтобы руководство устанавливало более крупный «лицензионный пакет». Он позволит руководящей группе иметь больше свободы и возможностей делать ставки на инновации. Это важный аспект ежегодного управления. Маск говорил, что «инновация, потерпевшая неудачу, не должна быть наказана».
От компаний, пострадавших от ИИ, потребуется обновление всей организации, чтобы влиться в обновленный мировой ландшафт. Высшее руководство должно жестко держать руку на пульсе и управлять процессами трансформации.
Одним из факторов, связанных с долгосрочным менеджментом, является создание новой организационной структуры, которая будет достаточно зрелой, чтобы легко адаптироваться к изменениям, вызванным искусственным интеллектом. Alphabet (Управляющая компания Google после реорганизации) – одна из самых ранних попыток. В этом отношении китайские компании внедряют больше управленческих инноваций, чем США.
Культура – это сила организации, которая может выйти за рамки нескольких поколений лидеров и деловой активности. Для многих зрелых компаний (Google, Baidu) доступ к возможностям искусственного интеллекта представляет собой серьезную проблему: потребность в новых талантах, новых патентах на технологии и создании новой культуры. Очень важно быть активными, терпеливыми и настойчивыми, поскольку культурная трансформация является одной из самых сложных задач для зрелого предприятия. Кроме того, забыть о старых методах работы гораздо сложнее, чем внедрить новые.
Так как мы находимся на начальной стадии развития искусственного интеллекта, привлечение и поддержание специалистов очень важно для управленцев.
В целом, долгосрочное планирование и стратегическое управление являются ключом к использованию любой важной возможности не только в эпоху ИИ. Как изменить существующую инфраструктуру, чтобы привлечь больше денег, талантов и добиться больших результатов – интересная и сложная задача для лидеров бизнеса. Решение глубоких, интересных и сложных проблем является признаком прогресса человечества.
Современное состояние развития технологий ИИ
Статьи на темы искусственного интеллекта, глубокого обучения и новых исследований выходят каждый день. Сегодня, как в эпоху Возрождения, наука меняется на глазах. Ведь истинный смысл науки заключается в том, чтобы наблюдать за миром и обобщать знания. Мы наблюдаем, как мир становится все более компетентным. Мы используем алгоритм глубокого обучения, и появляются новые знания.
Это не только физика, биология, материаловедение… Каждая область науки отчаянно быстро движется вперед. Таким образом, человечество находится в состоянии быстрого прогресса. Давайте в конце этой главы снова обратим внимание на квантовые вычисления.
Отметим очень интересную связь между искусственным интеллектом и нейро-вычислительными структурами, использующими распределенное векторное представление слов. Их основные операции основываются на линейной алгебре, а не булевой. Это говорит о том, что человеческий мозг в чем-то схож с физикой. Даже ученые предполагают, что человеческий мозг работает по принципу, аналогичному квантовой физике, теори и алгоритму квантовых вычислений.
Квантовые вычисления имеют важное значение в сфере искусственного интеллекта. Microsoft и Google, например, создали лабораторию квантового ИИ и ведут активную разработку проектов в этой области. Вопрос об уместности квантовых вычислений в ИИ не должен рассматриваться совсем. А вот вопрос о том, когда квантовые вычисления станут частью искусственного разума, уместен. Существуют разные мнения на это счет. Некоторые отмечают промежуток времени до 5 лет или даже меньше до того момента, как появятся ранние квантовые машины.
Почему квантовые вычисления так важны? Потому что они тесно соприкасаются с человеческим интеллектом. В основе квантовых вычислений лежит квантовая суперпозиция. Квантовая способность изменяет состояние при добавлении энергии. Современный компьютер может занимать только одну позицию – цифру 0 или 1. В то время как квантовые суперпозиции могут занимать три позиции одновременно. А их вычислительная мощность растет экспоненциально.
Преимущество в том, что многие проблемы с данными могут быть решены с помощью квантовых вычислений. Предыдущий подход – это разложение чисел. Например, шифрование и дешифрование данных, декомпозиция с использованием простых чисел. Довольно трудно получить большое число при разложении простых. Например, вычислить разрушение Земли таким образом практически невозможно. Но с помощью квантового алгоритма вычислений это станет не только возможным, но и относительно быстрым процессом. Этот алгоритм сделает машинное обучение вполне естественным.
В связи с этим необходимо усовершенствовать аппаратное обеспечение. В настоящее время все аппаратные средства базируются на булевой алгебре, а основные вычисления глубинного обучения обеспечиваются матричными и тензорными расчетами, а не вычислениями 0 и 1. И они должны выполнять дифференциальные операции. Квантовые вычисления идентичны, и каждый раз, когда квантовая энергия изменяется, образуется вычислительная связь между матрицей и тензором. Природа этих вычислений на самом деле та же самая, что и в человеческом мозге. Мэтью Фишер, Пан Цзяньвэй, Чжу Цин Чжи и другие ученые считают, что суть сознания – это квантовая запутанность.
В 2007 году журнал Nature опубликовал результаты лабораторных исследований, которые проводились под руководством Грэма Флеминга в Калифорнийском университете в Беркли. В ходе исследования лазеры сверхкоротких импульсов были применены для облучения светособирающих комплексов. Это помогло установить, что квантовые эффекты играют незаменимую роль в фоточувствительном синтезе. Революция в области квантовых вычислений – это доказательство единения природы и человеческого интеллекта. Открытие влияния квантовых эффектов на живые организмы в значительной степени вдохновило человечество на новые исследования квантовых вычислений и человеко-машинных комбинаций.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «ЛитРес».
Прочитайте эту книгу целиком, купив полную легальную версию (https://www.litres.ru/robin-li-29918481/baidu-kak-kitayskiy-poiskovik-s-pomoschu-iskusstvennogo/) на ЛитРес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
notes
Примечания
1
Поэма на тему «интеллектуальная революция» написана разумом Baidu. Она имитирует человеческие эмоции, однако существенно отличается от них (для того, чтобы гарантировать оригинальность, поэма публикуется без правок и модификаций). На мой взгляд, ничто не может лучше подойти в качестве предисловия к книге, чем стих, написанный машиной.
2
Используется для представления условной вероятности случайных событий A и B, где P (A | B) – это вероятность того, что в случае B произойдет А.
3
«Знание» – это точка зрения Кевина Келли в книге «Неизбежное», относится к программному обеспечению, которое охватывает все. Он считает, что все будет информационным, даже если данные о продажах и частоте кликов будут автоматически выгружаться в таблицу.
4
Чэнь Цзинжунь известен тем, что доказал теорему Гольдбаха «1+2». Репортаж Сюй Цзи, «Гольдбаховская гипотеза», был опубликован в первом номере журнала «Народная литература» в январе 1978 года Чэнь Цзинжунем, имя которого в то время стало нарицательным.
5
За последние несколько лет нейросети научились понимать, что за объекты находятся на фотографии и как они взаимойдействуют друг с другом. Например, чашка стоит на столе, а ложка находится внутри чашки. В экспериментальных сетях достигнут и обратный эффект: по текстовому описанию нейросеть способна воссоздать изображение, например женщину, едущую на лошади по лугу. – Прим. науч. ред.
6
Триллион операций в секунду – Прим. науч. ред.
7
Великобритания запустила «геномную программу 100 000 человек» в 2014 году, а США и Китай объявили о завершении сбора геномных данных до 1 миллиона человек. Данные, полученные всемирно известной компанией по секвенированию генов Illumina Instruments sequencing, удваиваются каждые 12 месяцев. Это огромная «черная дыра данных», а также золотодобывающая шахта данных.
8
Несмотря на возросшую активность за последние годы, даже передовые проекты с беспилотными такси не допускают перемещение авто по городу без оператора внутри, пусть и не на водительском кресле. – Прим. науч. ред.