+38 (093)  990-30-70

Новости

Королевский бал у Вас дома

Назви голосові команди управлінням живлення комп'ютера. Голосове управління комп'ютером на Windows: чи можливо

  1. Програма Speechka для голосового управління комп'ютером з Windows 7
  2. Що таке Агрегат
  3. Знайомтеся - Агрегат
  4. Що ж він вміє робити?
  5. Інтеграція з Дусею
  6. А що ж ще?
  7. Як ним користуватися?
  8. Як він виглядає?
  9. Хочу! Як його встановити?
  10. Створи свій Агрегат!
  11. Управління голосом на Windows
  12. Typle
  13. Управління жестами на комп'ютері
  14. Leap Motion
  15. DUO 3D
  16. Myo
  17. Управління комп'ютером з веб камери на ноутбуках
  18. Голосове управління телефоном
  19. Голосове управління комп'ютером
  20. Голосове управління в Google
  21. Голосове управління в Google Chrome
  22. Cortana
  23. Typle
  24. Speaker

Якому користувачеві комп'ютера не захотілося б керувати ним без допомоги рук, тобто, не доторкаючись до клавіатури і миші, а використовуючи лише свій голос? А для людей з обмеженими можливостями така функція просто незамінна. Оригінальна (не русифікована) має таку функцію, але вона розрахована тільки на англійську мову. Однак, і в русифікованої версії Windows 7 можливість голосового управління комп'ютером з Windows 7 можна ввести. Для цього існує кілька сторонніх програм.

Це одна з найбільш поширених утиліт для голосового управління комп'ютером з Windows 7. Її можна завантажити з інтернету. Вона має дві версії - безкоштовну і платну (premium). Нижче піде мова про безкоштовної версії.

Після запуску програма видає своє головне вікно:


Після запуску програма видає своє головне вікно:


У ньому потрібно задати ім'я користувача і текстовий зміст команди У ньому потрібно задати ім'я користувача і текстовий зміст команди. Після чого слід натиснути червону кнопку (запис) і сказати в мікрофон потрібну команду, наприклад, «відкрий зіп севен». Потім натиснути кнопку «додати». Цими діями в утиліті створюється звуковий образ команди управління.

Наступна дія - це прив'язка заданого звукового образу до конкретної програми або файлу на комп'ютері. Для цього потрібно клікнути в головному вікні по кнопці

І встановити галочку на потрібному нам пункті:

з'являється список встановлених програм комп'ютера, в якому слід вибрати 7-Zip File Manager. Потім необхідно натиснути на «запис» і «Додати».


Після цього в головному вікні в профіль користувача додасться створена команда:

Тепер залишається тільки перевірити її виконання. Для цього потрібно в головному вікні натиснути «Почати говорити» і вимовити заповітну фразу «Відкрий зіп севен, після чого утиліта 7-zip відкриється.

На жаль, не можна сказати, що Typle у всіх випадках правильно розпізнає російську мову, але це недолік більшості програм розпізнавання голосу.

Програма Speechka для голосового управління комп'ютером з Windows 7

Speechka є просту і зручну програму, що розпізнає російську мову. Ця утиліта дозволяє голосом відкривати програми, файли, папки і інтернет-сторінки, здійснювати пошук в Інтернеті. Програма безкоштовна і легко скачується і встановлюється.

Ось виглядає її головне вікно:

Залежно від своїх намірів користувач повинен натиснути одну з кнопок головного вікна Залежно від своїх намірів користувач повинен натиснути одну з кнопок головного вікна. Після натискання однієї з них справа від головного вікна з'являється вікно для завдання параметрів голосової команди. Наприклад, при натисканні «Інтернет» відкриється віконце такого виду:


У ньому вже показані налаштування, необхідні для запуску сторінки Яндекса з прогнозом погоди У ньому вже показані налаштування, необхідні для запуску сторінки Яндекса з прогнозом погоди. Після натискання кнопки «Додати» необхідно озвучити цю команду. Це робиться, як зазначено на головній сторінці, одночасним натисканням «Ctrl» і «Win», після чого потрібно сказати в мікрофон слово або фразу, наприклад «погода», і відпустити клавіші. У налаштуваннях програми є можливість активувати запис звуку по комбінації «Ctrl» + «Win», або просто за рівнем звуку.

Ось і настала весна ... У квітні 2014 го перша альфа версія Дусі з'явилася на форумі 4PDA.

І ось, через два роки, Дуся приходить на наші комп'ютери. У вигляді нового проекту під назвою Агрегат!

Ця стаття про те, що таке Агрегат, що він вміє робити і як його отримати.

Що таке Агрегат

Отже, що ж це таке - Агрегат? Як вам уже стало очевидно по нашому невеликому відео і нашому новому сайту, це голосовий асистент для комп'ютера. Це якщо зовсім коротко. Ну а подробиці - далі.

Знайомтеся - Агрегат

Дуся для ПК готувалася вже давно. Дуже давно - з найперших версій. І ось чому наш Агрегат відрізняється від Кортан:

  1. Розуміє російську (та й будь-який інший мову при бажанні)
  2. Працює на будь-якій операційній системі (Windows, Linux, Mac OS X)
  3. Запускається навіть на Raspberry Pi
  4. Легко розширюється за рахунок сторонніх модулів
  5. Гнучко настроюється під ваші вимоги
  6. Має відкритий API для розробників і відкритий вихідний код
  7. Інтегрується з асистентом на Android смартфоні

І так - Агрегат абсолютно безкоштовний!

Що ж він вміє робити?

Агрегат - немов конструктор Lego - збирається з безлічі модулів. Які модулі ви встановите - то і буде вміти робити ваш Агрегат. Схоже на Скрипти в Дусі, чи не так? Тільки модулі Агрегату - це повноцінні мікропрограми, які можуть виконувати будь-які дії на комп'ютері, або навіть управляти віддаленої технікою (включаючи ваш смартфон).

Поки Агрегат тільки в альфа-версії, і на даний момент модулів ще не так багато. Але зовсім скоро їх стане більше! А найголовніший модуль вже створений. Це ...

Інтеграція з Дусею

Альфа-версія Дусі 1.6.0 має функцію віддаленого управління . Саме завдяки їй ви можете відправляти команди на ваш смартфон прямо з вашого комп'ютера. А відповіді прийдуть назад на комп'ютер у вигляді мови і дій в браузері!

Ви можете писати СМС, дзвонити, створювати нагадування, дізнаватися плани, ставити лічильники, слухати новини, виконувати взагалі будь-які команди і скрипти, не беручи в руки телефон! При цьому діалог теж підтримується.

А що ж ще?

Модуль «Диктування» дозволить просто продиктувати будь-який текст, який тут же буде вставлений в поле введення відкритої в даний момент програми.

Наприклад, можна писати пошукові запити у вікні браузера, диктувати текст в текстовому редакторі, писати повідомлення в месенджерах і багато іншого.

Подивіться на відео, як я просто сказав «Дуся агрегат», коли курсор стояв в поле введення текстового запиту на сайті youtube.com.

Як ним користуватися?

Легко! Так само, як і у Дусі, у Агрегату є способи активації, розпізнавання і синтез мови.

Найпростіший спосіб активувати Агрегат і дати команду - це просто затиснути пару гарячих клавіш на клавіатурі, вимовити команду і відпустити клавіші. При цьому можна робити паузи - Агрегат буде слухати вас, поки ви не відпустите кнопки!

Розпізнавання, синтез і активації - це теж модулі Агрегату, які можуть бути різними

Як він виглядає?

Згадаймо ті славні часи, коли і у Дусі не було ніякого інтерфейсу крім налаштувань.

Для комп'ютерної версії голосового асистента це набагато важливіше. Тому що ви можете користуватися його функціями, не відкриваючи інше додаток, не відволікаючись від поточної роботи. Нічого не займає екран. Агрегат просто слухає вас і виконує команди. Швидко і чітко!

Хочу! Як його встановити?

Зараз Агрегат знаходиться на стадії раннього альфа-тестування. Тому він доступний тільки для ентузіастів і програмістів, які завжди прагнуть опинитися на передньому краї технологій.

Альфа-тестування відкрите. Тобто будь-хто може вступити в спеціальне співтовариство Google+ і відправити заявку на отримання копії свого Агрегату.

У співтоваристві можна задавати будь-які питання і обговорювати їх. Документація по проекту і Керівництво Пользвоателя вже готові в першому варіанті і доступна в репозиторії GitHub. Там же розповідається в подробицях, де скачати модулі, як їх налаштувати і як ними користуватися.

Там же доступні модулі, їх опис та вихідні коди (для тих, хто бажає приєднатися до проекту і стати співавтором першого в світі голосового асистента з відкритим кодом).

Створи свій Агрегат!

Я сподіваюся, що вам сподобається наш новий проект, в якому кожен може взяти участь як співавтор. І ви побачите, що тільки справжня свобода дає необмежені можливості вашій уяві зі створення свого власного голосового асистента під ПК!

Який гик не мріє керувати комп'ютером з дивана одними тільки жестами і голосовими командами? Як не дивно, але це вже можливо. А в самому найближчому майбутньому кожен другий буде махати руками перед монітором. У статті розглядається кілька способів і найближчих перспектив.

Управління голосом на Windows

Почнемо з безкоштовного софта, який дозволяє керувати комп'ютером за допомогою російської мови. Можна буде умовити його відкривати програми, виконувати якісь дії і так далі. І ваші руки будуть вільні для більш важливих справ.

Typle


Typle

Дана програма лідер серед програм, що дозволяють командувати комп'ютером рідною російською мовою. Після установки потрібно буде завести користувача і придумати йому ключове слово на кшталт «Ok, Windows», хоча нам радять слово «Відкрий». Саме з нього ми і починаємо говорити, знайома реалізація в Google Glasses існує.

Потім для користувача вибираємо команди. Можна додати тільки запуск будь-яких програм, а при натисканні додатково самостійно вибрати програму і дописати будь-якої аргумент. Можливо, якщо щось дописати до запуску програми, то буде і дії. Але в цілому, звичайному користувачеві покерувати комп'ютером повноцінно не вийде, ніяких тобі пауз або наступний трек, тільки запускати і запускати.

Управління жестами на комп'ютері

Ще з моменту появи PlayStation®Eye Camera і kinect люди захотіли такі ж функції і на комп'ютері. Пізніше Kinect навіть стали продавати розробникам, але для загального користувача такого товару не анонсували. І навіть є новина, що Kinect 2.0 з Xbox One не працюватиме на комп'ютері, але вийде спеціальна версія Kinect і для PC. Правда без відповідного софта користі від нього мало. Так що перейдемо до самого софту.


Найпопулярнішим і доступним способом управління жестами є програма Flutter і відповідне Chrome-розширення. Для цієї програми підійде майже будь-яка веб-камера.

Досить мало функцій, але зате вони дуже добре працюють. Ми можемо ставити на паузу і продовжувати показуючи долоню. Перемикати треки або відео наліво або направо, в залежності, куди вкажемо пальцем. Працює програма в PowerPoint, VLC, Winamp, iTunes, YouTube і декількох інших сервісів, які мало хто у нас використовує.

Для правильної роботи бажано бути на відстані від вебкамери, але не як попало. Лежачи виходить набагато гірше контролювати, ніж рівно сидячи. Особисто я користуюся тільки на YouTube, коли руки брудні досить зручно або коли лежиш. Випадкових рухів ще не було. Але все ж бувають похибки, коли просто сидиш і махати руками перед монітором як повний ідіот.

Напевно Flutter скоро отримає повну підтримку Chrome, адже стартап в жовтні 2013 року купила Google.

Leap Motion

Від софта перейдемо до пристроїв. Leap Motion вселяє довіру своїм маленьким видом і кількістю потенційних можливостей. Ця штука визначає руки користувача, точніше навіть кожен палець. Власний магазин з купою додатків і ігор не дає занудьгувати. І найголовніше, він вже продається і коштує якісь 5000 рублів. Не так багато за таку магію.

Але, насправді, тут багато мінусів. На Хабре було обговорень і навіть думка одного з користувачів. Руки завжди треба тримати зап'ястям вгору над пристроєм, думаєте легко? Потримайте 5 хвилин.

Щодо додатків теж великий мінус в тому, що всі безкоштовні глючат, вилітають. А ігри збіговисько незрозумілих лсд-тріп. Та й управляти незручно, точність грає в зворотну сторону і кожне невірний рух рукою призводить до непередбачених наслідком.

Та й сам дравйвер для Leap Motion буде зжирає майже всі ваші ресурси на комп'ютері. Але якщо і це вас не зупиняє, то купити, як завжди, на оф. сайті. Він навіть російською мовою.

DUO 3D

Схожа технологія від російських розробників теж існує. Вони просто взяли дві Eye Camera, написали софт і зробили компанію на кікстартера. На жаль, провальну. Зібрали 62 000 $ з 110 000 $ планованих. Прикро, тим більше, що вони не отримають навіть цих грошей, так як треба зібрати все, щоб вони надійшли.

Зараз пристроїв навіть у вільному продажу, але ми будемо сподіватися, що такі розробки наших людей не пропадуть просто так.

Myo

Гаразд, хто не чув про Myo. Браслет, що визначає жести не за допомогою камери, як конкуренти, а розпізнаванням руху м'язів. Гарний відеоролик і приголомшливі можливості підкупили всіх і навіть мене. Як тільки браслет буде у вільному продажу, будуть відомі додатки і все інтеграції, з'являться огляди, тоді і я куплю цю дивну річ.

Зараз браслет можна попередньо замовити за 150 $, але боюся потрапити на сиру версію.

Управління комп'ютером з веб камери на ноутбуках

Зараз творці ноутбуків люблять експериментувати з керуванням жестами. Компанія PointGrab просунулася в цій тематиці, концепт арт у них досить оптимістичний.

Продуктами цієї компанії користується Acer. А Lenovo на основі цих напрацювань зробить свій власний Motion Control 2.0.

А в вересня 2013 Intel анонсувала нові ноутбуки з голосовим управлінням, управлінням жестами, дотиком, а до цього літа компанія придбала ізраїльський стартап Omek.

Подивимося, що з цього всього вийде. У мене останнім часом вічне відчуття того, що майбутнє ось-ось поруч і так вже пару років. Мій матеріал можете доповнити своїми знаннями, може є ще якісь пристрої або способи, які теж варто було згадати?

Дуже скоро вся техніка, від телефонів до чайників буде оснащена голосовим управлінням. доступно вже давно і зараз секретні лабораторії великих корпорацій працюють над удосконаленням цієї технології. Але вже сьогодні ви можете скористатися цими технологіями майбутнього і покерувати комп'ютерною технікою за допомогою голосу.

Голосове управління телефоном

Уже не перший рік смартфони на найпопулярніших платформах (Android, iOS, Windows Phone ) Мають вбудовану систему голосового управління.


Siri - одне з кращих втілень штучного інтелекту в сучасній техніці. Siri - голосовий помічник вбудований в смартфони iPhone 4S який розуміє людську мову і може вести діалог з власником смартфона. Siri дозволяє управляти основними функціями смартфона, створювати завдання, шукати будь-яку інформацію і т.д.


Краще мене про Siri вам розповість відео яке я для вас підготував. Це уривок з презентації iPhone 4S якраз на тому місці, де один з розробників iPhone розповідає про Siri (якщо відео не видно - поновіть сторінку):


Сьогодні в Android смартфонах голосове управління нітрохи не поступається Siri (десь навіть перевершує) та Виконуємо практично ті ж завдання.

Голосове управління комп'ютером

Крім телефону ви можете навчити розуміти команди і ваш комп'ютер. В Windows Vista і Windows 7 теж є вбудована система голосового управління, тільки вона ще не доступна в російськомовній версії операційної системи. Для того щоб скористатися наприклад, англомовної системою голосового управління, ваша операційна система повинна бути Ultimate (Максимальна) або Enterprise (Корпоративна) і в ній повинен бути встановлений англійський мовний пакет. Але не дивлячись на всі ці обмеження є інші варіанти для того, щоб почати управляти комп'ютером за допомогою голосу.


Typle - одна з кращих програм дозволяє створювати різні голосові команди для комп'ютера. Ви записуєте голосову команду і призначаєте дію яке необхідно виконати після її проголошення. Typle цілком непогано справляється зі своїми обов'язками. Правда команди доведеться віддавати чітким, механічним голосом, щоб програма змогла розпізнати їх. І ще програма іноді може прийняти за голосову команду сторонні звуки . Тому не дивуйтеся якщо після установки і настройки Typle на вашому комп'ютері почнуть відбуватися незрозумілі події.


Голосовоеуправленіе.рф - хмарний сервіс і програма Speaker від російських розробників з дуже хорошим розпізнаванням мови. Speaker набагато краще розуміє людську мову. Ще одним плюсом програми, на відміну від Typle є те, що вона починає "слухати" команди тільки після натискання командної клавіші - на даний момент це коліщатко миші. Завдяки цьому програма не виконуватиме команди коли це не потрібно. Але на мою думку використання коліщатка в якості командної клавіші не зовсім зручно, тому як воно часто використовується в інших випадках.


Голосове керування в браузері Opera. Для шанувальників інтернет-браузера Opera є вбудоване голосове управління дозволяє управляти основними функціями браузера голосом. В Opera немає можливості створювати свої команди, а використовуються вже наявні команди англійською мовою. Але я думаю, що мало кого зацікавить такий функціонал, коли за допомогою миші і клавіатури можна виконати всі ті ж дії з не меншою швидкістю.

Голосове управління в Google

заслуговує на окрему увагу. Всім відомо що Google завжди створює якісні продукти і сервіси. Багато переконалися в цьому почавши наприклад, користуватися поштою Gmail. На даний момент є дві відомі мені можливості голосового управління сервісами Google.


Перша - це пошук інформації за допомогою голосу в пошуковій системі Google . Допомагає набагато швидше працювати з пошуковою системою.


Друга - Google перекладач, що дозволяє диктувати текст (поки тільки) англійською мовою і автоматично отримувати переклад на потрібну мову.


Цілком зручно використовувати голосове введення в Google Translate при читанні тексту з підручника англійської мови або наприклад, упаковки товару, для швидкого перекладу на російську мову необхідної інформації.

Голосове управління в Google Chrome

Розширення OWeb - доповнює собою вже наявні функції голосового управління в Google Chrome . OWeb додає можливість надиктувати голосом текст практично на всіх сайтах, де мається на увазі введення тексту - в формах пошуку, в контактних формах, в поле коментарів і т.д. Це звичайно не Siri, але теж відмінний спосіб звільнити руки і заощадити час на набір тексту.


Подивіться відео в якому я покажу вам можливості розширення Oweb і приклади його застосування:

Ще до релізу знаходиться на стадії розробки, тестування і налагодження інтерфейсу Cortana для Windows 10 користувачі намагалися організувати голосове управління комп'ютера. Про те, як таку функцію можна реалізувати в Windows, що вийшли до 10-ки і поговоримо в сьогоднішній статті.

Cortana

Кортан - голосовий помічник з ІІ, розроблений корпорацією Microsoft для Windows 10, Phone і Android з подальшим поширенням проекту на XBox і iOS. Вона замінює класичну пошуковий рядок і виконує безліч дій, в першу чергу, пов'язаних з пошуком інформації і системних команд, отримуючи їх від користувача у вигляді голосових команд. Глибока інтеграція в Windows 10, відсутність російської мови (поки що), збір фактично всієї інформації про користувача з відправкою на сервери Microsoft і відсутність фінальної версії не дають можливості більшості користувачів отримати повноцінне голосове управління власним комп'ютером.

Крім Кортан існує чимало програм, що дозволяють здійснювати управління ПК за допомогою голосових команд користувача. Ознайомимося з найпоширенішими продуктами для вирішення цього завдання в Windows 7 і 10.

Typle

Додаток займає лідируючі позиції серед російськомовних користувачів, що бажають командувати комп'ютером за допомогою голосу. Утиліта з легкістю замінить значну частину функцій Кортан на Windows 10, а на «сімці» додасть функцію, нерідко демонстрував у фільмах, де люди керують комп'ютерами за допомогою голосу.


Перед початком роботи створюємо обліковий запис і придумуємо ключову фразу, почувши яку додаток активується. Потім задаємо голосову команду з управління комп'ютером або виконання певної дії і закріплюємо за нею операцію (запуск програми, перехід на вказаний сайт). У вікні редагування створених команд з'являється можливість задавати параметри, з якими додаток буде запускатися, і вказати режим запуску (повноекранний, віконний).

Функціонал утиліти вельми обмежений, а інтерфейсу далеко до стилю Метро, ​​реалізованого в Windows 10. Повноцінне голосове управління ПК за допомогою Typle реалізувати не вдасться: вона підтримує тільки відкриття файлів, додатків (з аргументами) і перехід по заздалегідь заданим посиланням. Відсутня навіть підтримка управління програвачем (поставити на паузу, запустити наступний трек).

Speaker

  • створення знімків стану екрану;
  • перемикання розкладки клавіатури;
  • завершення роботи Windows 7;
  • запуск програми;
  • відкриття файлу.

Процес зчитування та розпізнавання надходить на мікрофон інформації запускається після натискання на задану клавішу (краще вибирайте кнопку, найменш рідко використовувану вами, щоб уникнути помилкових спрацьовувань програми). На обробку, розпізнання мови і виконання команди йде досить багато часу - 5 і більше секунд, чим доведеться заплатити за дешевизну. Ключові слова задаються текстом, а не словами, тому Незрозумілий мова порівнюється вже з введенням текстом, що робиться далеко не ідеально. Управління програвачем в додатку відсутній.

Розробники програмного комплексу для управління комп'ютером з Windows 7 і 10 є першою вітчизняною командою, яка випустила додаток для вирішення подібного роду завдань. За ядро ​​програми взята західна «Dragon Dictate», куди впровадили вітчизняний програмний модуль для розпізнання російської мови.

За ядро ​​програми взята західна «Dragon Dictate», куди впровадили вітчизняний програмний модуль для розпізнання російської мови

Крім виконання системних команд, Горинич вміє здійснювати голосове введення в текстових редакторах для Windows 10 з продуктивністю, що перевищує швидкість набору тексту середньостатистичним користувачем ПК. ІІ пристосовується до голосу користувача і з часом якість розпізнавання команд і тексту стає набагато вище, до чергової деінсталяції програми або перевстановлення ОС без збереження призначених для користувача даних.

З системних функцій програмний комплекс легко виконує запуск додатків, створення нових текстових файлів.


Як ним користуватися?
Як він виглядає?
Як його встановити?
Що ж він вміє робити?
Схоже на Скрипти в Дусі, чи не так?
А що ж ще?
Як ним користуватися?
Як його встановити?
Який гик не мріє керувати комп'ютером з дивана одними тільки жестами і голосовими командами?
Руки завжди треба тримати зап'ястям вгору над пристроєм, думаєте легко?