+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новини

Машинне викладання: як експертиза людей робить ІІ ще сильнішим

Машинне викладання: як експертиза людей робить ІІ ще сильнішим

Уявіть, що вам потрібно навчити п'ятирічної дитини відбивати м'яч у бейсболі. Ви даєте йому биту і м'яч, а потім просите мільйон разів кидати м'яч у повітря різними способами, сподіваючись, що він зрозуміє, як ці два предмети пов'язані. Зрозуміло, більшість людей не так робитимуть.

І тим не менше, зараз багато в чому саме так ми організовуємо машинне навчання: ми показуємо машинам безліч даних і очікуємо, що вони вивчать асоціації чи знайдуть закономірності самостійно.

Для більшості найбільш поширених сьогодні варіантів використання ІІ, таких як розпізнавання тексту або зображень, це працює відмінно.

Але люди хочуть використовувати ІІ у великій кількості сценаріїв, тому науковці та розробники Microsoft виробили новий підхід під назвою machine teaching, що можна перекласти як "машинне викладання". В його основі лежить уміння людей розбивати проблему на простіші завдання і давати моделям машинного навчання важливі підказки про те, як швидше знайти рішення. Це як вчити дитину спочатку просто тримати м'яч, потім освоїти подачу знизу і лише після цього перейти до кручених.

«Щодо людей це звучить дуже природно та інтуїтивно, але коли ми переходимо до машинного навчання, у всіх підхід такий: «Давайте відразу кидати системі кручені», — говорить генеральний директор підрозділу Business AI компанії Microsoft. — Машинне викладання — це набір інструментів, який допоможе вам так припинити».

Машинне викладання бере за основу знання, отримані від людей, а не лише витягує їх із даних. Людина, яка розуміє завдання, — Чи йдеться про те, як вирішити який підрозділ компанії має отримати вхідний лист або як автоматично розмістити вітрові турбіни, щоб генерувати більше енергії, спочатку розділить проблему на менші частини. Потім він надасть обмежений набір прикладів або план дій, щоб допомогти алгоритмам машинного навчання вирішити завдання.

Машинне викладання особливо корисне у сценаріях навчання з підкріпленням, коли маркованих навчальних даних для алгоритмів машинного навчання дуже мало чи ні зовсім, тому що галузь чи потреби компанії дуже специфічні. У складних та неоднозначних сценаріях навчання — коли алгоритми не можуть визначити, яку з мільйонів можливих дій вони мають зробити, щоб впоратися із завданням у фізичному світі, — машинне викладання може суттєво скоротити час, який потрібний інтелектуальному агенту для пошуку рішення. Це також частина більш масштабної мети — розширити коло людей, які використовують ІІ досконалішим способом. Машинне викладання дозволяє розробникам або профільним експертам, які не мають достатнього досвіду в сфері ІІ, таких як юристи, бухгалтери, інженери, медсестри або оператори навантажувача, впроваджувати важливі абстрактні концепти в інтелектуальні системи, які потім виконують механіки машинного навчання у фоновому режимі.

>

Дослідники Microsoft почали вивчати принципи машинного викладання близько десяти років тому, і ці концепції тепер впроваджуються при розробці продуктів, які допомагають компаніям створювати все, від роботів інтелектуальної служби підтримки до автономних систем.

«Навіть найрозумнішому ІІ без жодної допомоги буде непросто зрозуміти, як виконувати найскладніші завдання, так що часто зустрічаються в реальному житті. Тому необхідно, щоб системи ІІ під керівництвом людей дізнавалися про те, що ми вже знаємо, — сказав Гурдіп Палл, віце-президент з Business AI в Microsoft. — Дозволити неекспертам використовувати повністю готовий до вживання ІІ для виконання складних завдань — це справжня золота жила для машинного викладання».

Сьогодні, якщо ми намагаємося навчити машину навчальному алгоритму, що дозволяє дізнатися, що таке стіл, ми легко знайдемо набір даних із фотографіями ретельно маркованих столів, стільців та ламп. Ми надамо алгоритму величезну кількість маркованих прикладів, і він навчиться дізнаватися про характеристики столу. Але якщо вам доводилося вчити людину тому, як дізнатися стіл, ви, напевно, почнете з пояснення, що має чотири ніжки і плоский дах. Побачивши, що людина також додає до цієї категорії стільці, ви продовжите пояснення і повідомте, що стілець має спинку, а біля столу — ні. Ці абстракції та ланцюжок зворотного зв'язку є ключем до того, як люди навчаються, і вони також можуть доповнювати традиційні підходи до машинного навчання.

«Якщо ви можете чомусь навчити іншу людину, ви також можете навчати машину, використовуючи аналогічну мову», — говорить Патріс Сімард, видатний інженер Microsoft, один з перших фахівців підрозділу Microsoft Research, який почав працювати над технологією машинного викладання. Його команда перейшла до групи Experiences and Devices, щоб продовжити цю роботу та реалізувати подальшу інтеграцію машинного викладання з існуючими пропозиціями з віртуальним співрозмовником.

Мільйони потенційних користувачів ІІ

Сімард задумався про нову парадигму для створення ІІ-систем, коли зазначив, що багато доповідей на конференції з машинного навчання стосуються вдосконалення роботи алгоритмів, заснованих на ретельно відібраних умовах. Але він розумів, що в реальному світі викладання є настільки ж важливим або навіть найважливішим компонентом пізнання, особливо для простих завдань в умовах обмеженого обсягу доступних даних.

Якщо хочете навчити систему ІІ вибирати найкращий автомобіль, але у вас є лише кілька прикладів, маркованих як «хороший» або «поганий», ґрунтуючись на цій обмеженій інформації, вона може припустити, що визначальна характеристика гарного автомобіля – це цифра «2 » на четвертому місці у номері. Але вказавши системі ІІ на ті ж характеристики, які ви б попросили враховувати вашу дитину-підлітка — витрати бензину, рейтинги безпеки, результати краш-тестів, ціна, — Ви допоможете алгоритмам правильно відрізняти хороші автомобілі від поганих, незважаючи на обмежену кількість маркованих прикладів.

Машинне викладання покращує моделі у сценаріях навчання з підкріпленням, виділяючи високорівневі значущі характеристики. Як і в програмуванні, мистецтво машинного викладання полягає у поділі основного завдання на дрібніші елементи. Якщо необхідних характеристик немає, їх можна створити, використовуючи субмоделі нижчого рівня, досить прості, щоб їх можна було вивчити на кількох прикладах. Якщо система постійно робить ту саму помилку, цю помилку можна виключити, додавши додаткові характеристики або приклади.

Один із перших продуктів Microsoft з моделями машинного викладання — інструмент розпізнавання мови в Azure Cognitive Services, який ідентифікує задум та ключові концепції для коротких текстів. Він використовується різними компаніями, від UPS до Progressive Insurance і Telefonica, для розробки ботів інтелектуальної служби підтримки.

«Щоб зрозуміти, чи стосується питання користувача рахунків чи тарифного плану, вам не потрібно давати нам усі варіанти питань. Достатньо надати чотири-п'ять варіантів, а також важливі характеристики та ключові слова, і функція розпізнавання мови подбає про механізми, які це забезпечать», — говорить Ріхам Мансур, старший менеджер з розробки програмного забезпечення для розпізнавання мови.

Дослідники Microsoft вивчають можливості застосування концептів машинного викладання для вирішення складніших проблем, таких як класифікація довших документів, електронних листів і навіть зображень. Вони також працюють над тим, щоб зробити процес викладання більш інтуїтивним, наприклад, пропонуючи користувачам вибрати, які характеристики можуть бути важливими для вирішення завдання.

«Уявіть, що компанія хоче використовувати ІІ, щоб перевірити всі документи та електронні листи за минулий рік і з'ясувати, скільки комерційних пропозицій було розіслано клієнтам і за скільки продаж відбувся», – каже Алісія Едельман Пелтон, старший програмний менеджер Групи машинного викладання Microsoft.

Насамперед система має знати, як відрізнити комерційну пропозицію від контракту чи виставленого рахунку. Найчастіше маркованих навчальних даних для таких завдань не існує, особливо якщо кожен спеціаліст відділу продажів вирішує це питання по-своєму.

Якби система використовувала традиційні техніки машинного навчання, компанії було б потрібно виводити цей процес на аутсорс, відправляючи тисячі прикладів документів та детальних інструкцій, щоб ціла армія людей спробувала коректно їх промаркувати, — процес, для якого можуть знадобитися багато місяців ретельної роботи: видалення помилок та пошук релевантних прикладів. Їм також знадобляться експерти з машинного навчання, які будуть дуже потрібні — вони допоможуть побудувати модель машинного навчання. І якщо нові фахівці з продажу почнуть використовувати інші формати, застосування яких система не була навчена, модель заплутається і перестане успішно працювати.

«Навпаки, – каже Пелтон, – машинне викладання Microsoft може використовувати людину всередині компанії, щоб виділити визначальні характеристики та структури, які найчастіше зустрічаються в комерційній пропозиції: це те, що відправляє спеціаліст з продажу, там вказано ім'я покупця поза компанією, є слова «ціна» або «термін постачання», «продукт», «кількість», «умови оплати».

Воно перекладає знання цієї людини мовою, яку машина може зрозуміти і, використовуючи попередньо обраний алгоритм машинного навчання, виконати завдання. Це допоможе замовникам створювати кастомізовані рішення на базі ІІ за секунди, використовуючи знання, які вже є в їхній організації», – каже Пелтон.

Пелтон зазначає, що величезна кількість людей у ​​світі «розуміє свій бізнес і може описати важливі концепти — наприклад, юрист, який каже: «О, я знаю, як виглядає контракт і як виглядає повістка, і я можу сказати, в чому полягає різниця між ними».

Робимо складні проблеми, що вирішуються

Більше десяти років тому Хаммонд працював системним програмістом у нейробіологічній лабораторії в Єлі, і він помітив, що вчені використовують покроковий підхід для навчання тварин виконання завдань, необхідних для досліджень. Це стало для нього справжнім одкровенням: він вирішив використати ту ж саму методику для навчання машин.

У результаті він створив компанію Bonsai, придбану Microsoft торік. Вона поєднує технології машинного викладання з глибоким навчанням із підкріпленням та симуляцією, щоб допомогти компаніям розробляти «мозки», що управляють автономними системами в додатках, від роботизації та виробництва до енергетики та домоуправління. Платформа використовує мову програмування Inkling, щоб допомогти розробникам і навіть профільним експертам розкласти проблеми на складові та написати програми для ІІ.

«Глибоке навчання з підкріпленням, гілка ІІ, в якій алгоритми навчаються методом спроб і помилок, заснованому на системі заохочень, вже успішно обігрує людей у ​​відеоігри. Але ці моделі поки що не можуть навчитися вирішувати складніші промислові завдання у реальному житті», – каже Хаммонд.

Наприклад, уявіть, що виробнича компанія хоче навчити інтелектуального агента автономно калібрувати важливе обладнання, робота якого може бути порушена при перепадах вологості чи температури, або після тривалого використання. На мові Inkling людина створює план уроку, в якому виділяє релевантну інформацію, необхідну для виконання завдання та контролю правильності роботи системи.

Збройна цією інформацією зі свого компонента машинного викладання система Bonsai вибере найкращу модель навчання з підкріпленням та створить «мозок» на базі ІІ, щоб знизити затратний час простою шляхом автономного калібрування обладнання. Він протестує різні варіанти дій у режимі моделювання і буде винагороджений або покараний, залежно від того, як швидко та точно виконає калібрування.

«Повідомляючи це «мозок» на базі ІІ, на чому важливо сфокусуватися перш за все, ми можемо заощадити безліч безплідних і витратних за часом спроб, коли ІІ в процесі симуляції намагається зрозуміти, що працює, а що ні», – говорить Хаммонд .

«Причина, через яку машинне викладання є критично важливим, — у тому, що якщо тільки нативно використовувати навчання з підкріпленням, не даючи йому жодної інформації щодо вирішення проблеми, система буде проводити довільні дослідження, і велика ймовірність, що результату досягнуто не буде,—каже Хаммонд. — Машинне викладання допомагає вирішити проблеми, які без нього залишаться нерозв'язними».

Інші новини