Дослідження методів штучного інтелекту для реалізації системи розумного дому
Анотація: Досліджені методи штучного інтелекту, які використовуються в системах розумного дому.
Бібліографічний опис статті:
Владислав Самоцкий. Дослідження методів штучного інтелекту для реалізації системи розумного дому//Наука онлайн: Міжнародний електронний науковий журнал - 2018. - №4. - https://nauka-online.com/publications/technical-sciences/2018/4/doslidzhennya-metodiv-shtuchnogo-intelektu-dlya-realizatsiyi-sistemi-rozumnogo-domu/
Технічні науки
УДК 004.891.3
Самоцький Владислав Олександрович
студент
Харківського національного університету радіоелектроніки
ДОСЛІДЖЕННЯ МЕТОДІВ ШТУЧНОГО ІНТЕЛЕКТУ ДЛЯ РЕАЛІЗАЦІЇ СИСТЕМИ РОЗУМНОГО ДОМУ
Анотація. Досліджені методи штучного інтелекту, які використовуються в системах розумного дому.
Ключові слова: штучний інтелект, методи, розумний дім.
У наш час персональні комп’ютери відіграють важливу роль майже у всіх сферах діяльності людини. Обчислювальна техніка значно полегшує працю людини. Сьогодні у зв’язку з розвитком інформаційних технологій, появою їх у всіх сферах життєдіяльності людини, збільшенням обсягів і потоків інформації, що зберігається в основному на електронних носіях, проводиться автоматизація майже усіх сфер діяльності. Навіть сфери діяльності, які, здавалось би, ніяк не можуть обійтись без участі людини, автоматизуються.
Питання людино-машинного взаємодії є одними з найважливіших при створенні нових комп’ютерів. Найбільш ефективними засобами взаємодії людини з машиною були б ті, які є природними для нього: через візуальні образи і мову. Створення мовних інтерфейсів могло б знайти застосування в системах самого різного призначення: голосове управління для людей з обмеженими можливостями, надійне управління бойовими машинами, «розуміючими» тільки голос командира, автовідповідачі, обробні в автоматичному режимі сотні тисяч дзвінків на добу (наприклад, в системі продажу авіаквитків) і т.д. При цьому, мовної інтерфейс повинен включати в себе два компоненти: систему автоматичного розпізнавання мови для прийому мовного сигналу і перетворення його в текст або команду, і систему синтезу мовлення, що виконує протилежну функцію – конвертацію повідомлення від машини в мову [1].
Однак, не дивлячись на стрімко зростаючі обчислювальні потужності, створення систем розпізнавання мови залишається надзвичайно складною проблемою. Це обумовлюється як її міждисциплінарним характером (необхідно володіти знаннями в філології, лінгвістиці, цифровій обробці сигналів, акустиці, зі статистикою, розпізнаванні образів і т.д.), так і високою обчислювальною складністю розроблених алгоритмів. Останнє накладає суттєві обмеження на системи автоматичного розпізнавання мови – на обсяг оброблюваного словника, швидкість отримання відповіді і його точність. Не можна також не згадати про те, що можливості подальшого збільшення швидкодії ЕОМ за рахунок вдосконалення інтегральної технології рано чи пізно будуть вичерпані, а все зростаюча різниця між швидкодією пам’яті і процесора тільки посилює проблему.
Можна виділити три головні проблеми концепції розпізнавання мови. Перша проблема – як буде виглядати модель розпізнавання мови, якщо не використовувати популярну, але малопродуктивну вірогідну модель? Тут багато що залежить від поставлених завдань і застосування системи. Друга проблема – на чому має ґрунтуватися вибір опису первинного мовного сигналу? Ця проблема тісно межує з можливостями розуміння людиною процесів формування мови. Тут великі надії подає квантова теорія мови, але поки що в більшості систем використовується стандартний статистичний аналіз акустичних параметрів мовлення. Також перспективним виглядає використання нейронних мереж. Третя проблема – проблема взаємодії первинних мовних ознак з більш високими рівнями (семантика, прагматика) при відмові від класичної лінійної моделі вхідного мовного сигналу. Тут основними завданнями є подолання проблем омонімії, «словесного сміття», перешкод різного типу, а також коректної побудови бази знань, системи попереднього навчання і аналізу [2].
Після проведення дослідження основних методів штучного інтелекту, а саме методів розпізнавання мовлення, було обрано стратегію агрегації для реалізації системи розумного дому. Дана стратегія дозволяє, за рахунок часу аналізу та кількості запитів, покращити ефективність розпізнавання та аналізу мовних команд для системи розумного дому. На сам перед, система повинна точно зчитувати мовну команду за рахунок якісної апаратури високої чіткості. Наступний етап – передача даних на різноманітні сервіси або бібліотеки оцінювання мовлення. Перший крок – передача даних для розпізнання. У разі невдалого розпізнання команди виконується наступний запит до іншої системи або бібліотеки розпізнання команд. Другий етап – пошук співпадіння команди зі списком, який представляє інтерфейс даної системи. Співпадіння вираховується за рахунок логічної схожості команд системи та мовної команди користувача. Наприклад, команди «погасити світло» та «вимкнути світло» являються ідентичними с точки зору користувача, але різними з точки зору повного спів падіння. Даний етап дозволить розпізнавати команди без точного спів падіння. Наступний етап – оцінювання команди на наявність глузду. Даний етап виконується аналогічним чином: розпізнана команда передається до сервісу аналізу мовлення, у разі негативної відповіді, запит виконується повторно до наступної системи. Якщо запити до всіх систем були негативними, то система дає відмову на виконання даної команди, в іншому випадку, система дає команду системі, до якої відноситься дана команда, на виконання [3].
Таким чином дослідивши, оцінивши та обравши стратегію агрегації майбутня система наділяється такими показниками як: стресостійкість, надійність (за рахунок етапу оцінювання наявності глузду), незалежність від сторонніх ресурсів (велика кількість ресурсів дозволяє взаємозамінювати сервіси розпізнання мовлення).
Література
- Szeliski, R. Computer Vision: Algorithms and Applications [Текст] / R. Szeliski. – Springer, 2010. – 55-60 – ISBN: 978-1848829343.
- Гефке Д.А., Зацепин П.М., Применение скрытых марковских моделей для распознавания звуковых последовательностей / Известия 133 Алтайского государственного университета. – Вып. 1(73), т. 2. – Барнаул: Известия АГУ, 2012. – с. 72-76.
- Шелепов В.Ю., Ниценко А.В., Структурная классификация слов русского языка. Новые алгоритмы сегментации речевого сигнала и распознавания некоторых классов фонем, Искусственный интеллект, 2007, № 1. – С. 139-147.
Коментарі закрито.
To comment on the article - you need to download the candidate degree and / or doctor of Science