Голосове управління клавіатурою. Я користувався диктуванням і управлінням голосом тиждень і ось що вийшло

Історія розвитку голосового управління
Можливості Cortana і голосового введення на сьогоднішній день
сторонні програми
Speaker
Laitis
Можливості управління голосом через Яндекс.строку
Навіщо я зв'язався з диктуванням взагалі
День перший: навчання
День другий: настройка і використання мовних сервісів на комп'ютері
День п'ять: нарешті, голосове управління стало зручним
День сьомий: прийняття факту і повернення клавіатури
Що таке Агрегат
Знайомтеся - Агрегат
Що ж він вміє робити?
Інтеграція з Дусею
А що ж ще?
Як ним користуватися?
Як він виглядає?
Хочу! Як його встановити?
Створи свій Агрегат!
Speechka
Speaker
Горинич
Windows Speech Recognition
Інші утиліти
Список програм для розпізнавання тексту і записи під диктовку

Для людей з обмеженими можливостями, а також просто для сибаритів, розробники ОС створили голосове керування комп'ютером. Воно дозволяє користувачеві вводити інформацію за допомогою голосу. Після промовляння певних слів пристрій починає розпізнавання мови - перетворення звукового сигналу в цифрову інформацію. Після того, як введена інформація буде коректно розпізнано - програма переходить до заданим алгоритмом дії - виконує функцію, яка прикріплена до тій чи іншій команді.

Все досить просто. Не завжди мова розпізнається коректно, тому для вирішення складних завдань з управління операційною системою програма голосового управління комп'ютером інтенсивно не використовується. Вона застосовується для виконання основних функцій: відкриття і закриття файлів, локального і мережевого пошуку і ін.

Історія розвитку голосового управління

Перша система розпізнавання голосу Audrey була створена в 50-х роках ХХ століття. Вона розшифровувала лише цифри, обговорені одним голосом.
У 1962 р була створена перша система розпізнавання слів. Вона розшифровувала 15 англомовних слів.
З розвитком комп'ютерів в 1990 р була розроблена програма Dragon Dictate. Вона розпізнавала до 100 слів за хвилину, але відрізнялася високою ціною.
На початку 2000-х років в iPhone з'явився додаток для розпізнавання мови Google Voice Search. У 2010 році була додана система пошуку в Android.
Siri була включена в програмне забезпечення Phone 4S на початку жовтня 2011 р;
в 2014 р була представлена Cortana - голосова помічниця для Windows.

Siri була включена в програмне забезпечення Phone 4S на початку жовтня 2011 р; в 2014 р була представлена Cortana - голосова помічниця для Windows

Можливості Cortana і голосового введення на сьогоднішній день

«Кортан» - це віртуальний помічник в операційній системі Windows . Сервіс допомагає користувачеві в плануванні справ, нагадує про них.
При певному запиті сервіс допоможе зібрати конкретну інформацію, створити чітку структуру і піднести її користувачеві в максимально можливо обробленому вигляді.
Цікаво, що відразу при включенні віртуальний помічник збирає всю інформацію про всі вжиті запитах, особистих даних, намагаючись максимально адаптуватися під кожного окремого користувача.

Голосове керування комп'ютером Windows 7 за допомогою використання віртуального помічника неможливо - він інтегрований тільки в десяту версію. Але, як не шкода, розробники не спромоглися випустити російськомовну версію.
Головну роль відіграє пошук, який в 10-ке можна відкрити через «Пуск». Ця функція визначає практично будь-які запити. Якщо входження не розпізнано - можна ввести відповідну команду у спливаюче вікно і програма голосового управління комп'ютером вважає текстову інформацію.

Неприємний момент - збір всіх даних, введених через клавіатуру, і їх відправка в «Майкрософт».

сторонні програми

Typle

Після виконання установки переходимо до наступного кроку - створюємо обліковий запис . Тут необхідно придумати ключову фразу, після чого прозвучить повідомлення про активацію.
Після виконання установки переходимо до наступного кроку - створюємо обліковий запис
Далі потрібно буде придумати і створити голосові команди , Незалежно від їх призначення. Команда «собака» може запускати додаток або виконувати зовсім іншу дію.

Просто потрібно створити голосову команду і закріпити її за певною дією. Підійде тільки для виконання базових операцій - відкриття файлів, папок та ін. Функціонал обмежений.

Speaker

Тут функціонал більш широкий, ніж в Typle.

Голосове управління комп'ютером Windows 10 надає користувачеві можливість відкривати і закривати файли, робити знімки стану екрану, вимикати ПК.

Розпізнавання мови відбувається досить довго, понад 3-4 секунд. Це обумовлено тим, що спочатку мова перетворюється в текст, а команди розпізнаються комп'ютером вже з текстової інформації.

Laitis

Це безкоштовна програма, яка дозволяє як управляти ПК, так і диктувати текст. Після установки необхідно зареєструватися і далі можна користуватися собі на втіху.

Цікава функція автозаміни при наборі тексту. Ви можете сказати «Лапки» і в тексті з'явиться відповідний символ.

Можливості управління голосом через Яндекс.строку

За допомогою використання цього додатка можна виконувати локальний або мережевий пошук інформації і файлів, перезавантажити або вимкнути комп'ютер. Присутня функція відкриття програм і сайтів.
Щоб скористатися програмою, необхідно спочатку завантажити та встановити її.
За допомогою використання цього додатка можна виконувати локальний або мережевий пошук інформації і файлів, перезавантажити або вимкнути комп'ютер

Але при установці варто прибрати галочки навпроти пунктів, де виробник софта пропонує встановити браузер, поміняти його налаштування. В іншому випадку установка займе більше часу і в браузері зміниться конфігурація.
В кінцевому підсумку рядок розміщується близько кнопки «Пуск». Скажіть «Слухай Яндекс» і відкриється вікно.
Але при установці варто прибрати галочки навпроти пунктів, де виробник софта пропонує встановити браузер, поміняти його налаштування
Проговорите запит.

Після паузи в браузері відкриється рядок пошуку. Цікаво управляти пошуком таким чином.
В цілому, голосове управління комп'ютером поки не розвинене, тому що малюється нам в уяві. Але і ті функції, що є на сьогоднішній день, вже вражають і суттєво допомагають перейти на новий рівень користування ПК.

Здається, куди не глянь, голосове управління і диктування додаються в усі додатки, операційні системи та ігрові приставки. Нам подобається сміятися над тим, як погано вони працюють, однак я вирішив зануритися в тему з головою, для себе подивитися на те, як це все працює, використовувати голосові функції ... для всього. Ось що з цього вийшло.

Навіщо я зв'язався з диктуванням взагалі

Як всякий фанат наукової фантастики я був заінтригований управлінням промовою і диктуванням. У фільмах це виглядає круто , І хоча ми ще не добралися, наближаємося до зображеного в кіно щодня. Подобається нам чи ні, в найближчі роки ми будемо управляти нашими комп'ютерами і телефонами промовою все частіше.

Диктування також має якийсь романтичний наліт. Це сучасний еквівалент бурмотіння своїх думок в диктофон . Тільки тепер наші слова відображаються і в тексті поки ми говоримо. Для того, хто цілий день барабанить по клавішах, це звучить шикарно. Може, я зможу писати на ходу. Або, якщо вже чесно, може, зможу писати не вилазячи з ліжка або навіть не сідаючи. (Ось, мрія!)

Насправді ж, хоч я і не мав особливих ілюзій про те, як все пройде, можливість насолодитися бесідою зі своїми гаджетами перемогла. Чи буду я звучати і виглядати смішно? Так, буду. Чи буду діставати своїх друзів, відповідаючи на текстові повідомлення в громадських місцях, розмовляючи з телефоном? Так, буду. Але можливість закохатися в таку життя варто спроби.

День перший: навчання

З перегляду безлічі науково-фантастичних фільмів здається, що управління голосом - процес інтуїтивно зрозумілий. У перший же день я усвідомив, що це далеко не так. Почав я з спроби написати кілька постів в блог за допомогою диктування. Ось витяг моєї першої спроби. Просто для розуміння того, як погано я уявляв собі, як користуватися сервісом:

, УдалітьНазадГоворітьПустьДжессіка як ти кажеш в мій телефон звучить добре

Ясно, що перше, що сталося - я сказав невірне слово, яке постарався видалити. Потім я недовго покричав на комп'ютер. Що ж, мабуть, щоб пристосуватися, буде потрібно якийсь час.

Добре, що у нас хоч інструкція є. Так що я підсунув мікрофон ближче, навчився основам форматування (треба говорити «кома», «пробіл», і т.д.) і спробував знову. Спочатку я взявся за простенький текст. Ось що вийшло:

Ця цитата взята з нашого недавнього інтерв'ю про Фрікономіка з співзасновником wired Кевіном Келлі, і є гарним нагадуванням про те, що цей буде необхідно визначити окремо.

О, це вже набагато краще першої спроби. Навіть «Фрікономіка» розпізнав. Довелося все ж повернутися і додати велику букву на початку Wired, змінити «буде» на «інструмент». Окремо стоїть мікрофон (невбудованої в ноутбук - прім.пер.), З'єднаний з розумінням команд пунктуації зробив текст ясніше.

Однак, мене бентежили не тільки помилки системи, скільки сам факт, що треба говорити те, що я хочу надрукувати. Виявилося, що диктування не така інтуїтивно ясна річ як я думав. Виявилося, щоб придумати, що я хочу надрукувати далі, мені треба робити довгі паузи. Коли друкуєш, у тебе море часу - можна зупинитися і подумати над таким реченням, а диктування і мова змушують бажати рухатися швидше. Мені знадобилося якийсь час, щоб звикнути.

Варто зазначити, що використання диктування на моєму iPhone для коротких текстових повідомлень або пошти пройшло набагато глаже. Через самої природи текстових діалогів - вони короткі - диктування на телефоні далася мені легше. Мені навіть подобалося диктувати відповіді, хоча я явно дратував оточуючих.

День другий: настройка і використання мовних сервісів на комп'ютері

Коли прийшов другий день використання диктування, я зрозумів, що якщо я хочу ще більше користі від сервісу, доведеться влізти в предмет ще глибше. Це означало, що треба вивчати самі мовні команди, а не обмежуватися диктуванням.

А це більше, ніж диктувати, що хочеш сказати, це вміння редагувати на льоту. На Маке, як виявилося, якщо хочеш повністю управляти текстом, треба включити мовні команди: відрийте «Налаштування системи», потім «Доступ», там вибирайте «Диктування», натисніть на кнопку «Команди диктування» і, нарешті, виділіть чекбокс «Включити розширені команди ».

Включивши розширені команди, я зміг управляти комп'ютером, відкривати програми та, головне, редагувати текст. Ось тут я усвідомив помилку першого дня. Щоб видалити невірне слово, треба сказати не просто «видалити», а «видалити це». Тепер я міг редагувати такими командами як «вирізати це», «копіювати це», «відкотити назад це» і «це з великої літери». Якщо ж ви не впевнені, що треба сказати, щоб зробити дію, ви можете вимовити «показати команди» і отримаєте спливаюче вікно з доступними командами.

Користувачам Windows доступні інші набори команд, але в загальному вони схожі, хоча їм можна просто сказати «видалити» замість «видалити це». Досвіду використання управління промовою в Windows у мене немає, але включити команди просто: в пошуку знаходите «розпізнавання мовлення Windows» (оригінал тексту призводить включення функції в Win7, до якої у мене доступу немає. Прим. Пер.).

Просунуті команди на Маке дозволяють вам управляти і додатками. Можна використовувати такі команди як «переключитися на [назва програми]», «відкрити документ» і «натиснути на [предмет]», тобто робити що завгодно. Немає команди на дію, яке хочете зробити? В налаштуваннях натисніть "+" і додайте власну команду. Друкуєте фразу, яка буде викликати дію, вибираєте додаток для управління, потім вказуєте заходів, яких треба провести. Я особисто залишився з клавіатурними скороченнями.

Можливість, приміром, в Chrome на команду «поміняй таб» повісити скорочення Command + Option + Стрілка повністю змінила те, як я користувався командами голосом. Якщо вже хочеться ще сильніше зануритися в процес - можете почати. Моїх початкових знань на це не вистачило.

Те ж можна сказати про Siri. C нею треба точно знати, що можна говорити, а що ні. Варто визнати, однак, що і Siri (та й Google Now ) Більше інтуїтивно зрозумілі в мовних командах, ніж звичайний ПК. Управляти всім на телефоні голосом дуже просто і, якщо ви звикли, що на вас поглядають, навіть приємно. Сьогодні тільки другий день, а я вже лінуюся друкувати повідомлення двома руками. Сумно, але мені все одно.

День п'ять: нарешті, голосове управління стало зручним

Четвертий день пройшов даремно, але на п'ятий я, нарешті, втягнувся. Я не тільки можу працювати, але можу працювати ефективно.

У мене на всі необхідні дії створені мовні команди. Я можу перемикати таби в браузері, вікна, запускати додатки, керувати діями в них (наприклад, команда «далі» переходить між статтями в RSS клієнта) і можу провести майже весь день у цілому клавіатури або миші. Це по своєму круто, хоча голос у мене став хрипким.

Диктування теж стала виходити. Треба повністю перебудувати мозок: адже раніше ви спілкувалися друкуючи, а тепер голосом. Так що для звикання потрібен час. На початку пару днів я друкував простими реченнями, тепер же я зміг включити в тексти свій «голос». Здавалося б, все відразу повинно вийти, але голосова диктування не приносить персоналії в текст. Мені для цього довелося попрацювати. Я не кажу так, як друкую. Більш того, під час диктування я ходжу туди-сюди, що, як виявилося, дуже мені підходить.

Варто згадати, однак, що команди з диктування почали проникати в моє життя. Як мінімум один раз я реальній бесіді я вимовив «кома» вголос. Упевнений, що це походить від того, що я повністю занурився в управління промовою, але згадати варто. Добре, хоч, співрозмовник сприйняв мій пасаж з гумором.

День сьомий: прийняття факту і повернення клавіатури

Підійшовши до кінця мого досвіду, я звик до диктування голосом і мовному управління. У обох сервісів є плюси, але я повернувся до клавіатури і миші.

Майже у всіх статтях, де згадується диктування, автори вказують, що стаття, мовляв, написана повністю за допомогою диктування. Частенько в статтях зустрічаються кумедні помилки, не вистачає пунктуації або слова стоять в дивному порядку. Цю статтю я написав повністю диктуванням. Але і редагував я її диктуванням. А коли закінчив, я відредагував її за допомогою клавіатури і миші. Потім я вислав її іншим людям на редактуру. Якщо ви не позбавлені можливості друкувати, диктування просто інструмент. Це не відповідь для автора. Вам все одно треба редагувати після голосової диктування (це, врешті-решт, і є авторство).

Управління ж промовою штука весела пару днів, а потім набридає. Як на мене, так клавіатурні скорочення використовувати швидше. Навігація голосом швидше дратує, ніж допомагає. Але так хоч можна чіпси їсти не заляпавши миша. Друкувати теж легше, тому що голова у мене під цю справу заточена. Сумно, що друкую я набагато краще, ніж говорю - навіть після тижневого користування диктування мова покращилася ледь. Це був веселий досвід, але мені здається, що переучуватися на диктовку в довгостроковій перспективі не варто зусиль. Звичайно, я можу ліниво друкувати статті, лежачи на підлозі (або стоячи, якщо немає місця за столом), але краще

Ось і настала весна ... У квітні 2014 го перша альфа версія Дусі з'явилася на форумі 4PDA.

І ось, через два роки, Дуся приходить на наші комп'ютери. У вигляді нового проекту під назвою Агрегат!

Ця стаття про те, що таке Агрегат, що він вміє робити і як його отримати.

Що таке Агрегат

Отже, що ж це таке - Агрегат? Як вам уже стало очевидно по нашому невеликому відео і нашому новому сайту, це голосовий асистент для комп'ютера. Це якщо зовсім коротко. Ну а подробиці - далі.

Знайомтеся - Агрегат

Дуся для ПК готувалася вже давно. Дуже давно - з найперших версій. І ось чому наш Агрегат відрізняється від Кортан:

Розуміє російську (та й будь-який інший мову при бажанні)
Працює на будь-якій операційній системі (Windows, Linux, Mac OS X)
Запускається навіть на Raspberry Pi
Легко розширюється за рахунок сторонніх модулів
Гнучко настроюється під ваші вимоги
Має відкритий API для розробників і відкритий вихідний код
Інтегрується з асистентом на Android смартфоні

І так - Агрегат абсолютно безкоштовний!

Що ж він вміє робити?

Агрегат - немов конструктор Lego - збирається з безлічі модулів. Які модулі ви встановите - то і буде вміти робити ваш Агрегат. Схоже на Скрипти в Дусі, чи не так? Тільки модулі Агрегату - це повноцінні мікропрограми, які можуть виконувати будь-які дії на комп'ютері, або навіть управляти віддаленої технікою (включаючи ваш смартфон).

Поки Агрегат тільки в альфа-версії, і на даний момент модулів ще не так багато. Але зовсім скоро їх стане більше! А найголовніший модуль вже створений. Це ...

Інтеграція з Дусею

Альфа-версія Дусі 1.6.0 має функцію віддаленого управління. Саме завдяки їй ви можете відправляти команди на ваш смартфон прямо з вашого комп'ютера. А відповіді прийдуть назад на комп'ютер у вигляді мови і дій в браузері!

Ви можете писати СМС, дзвонити, створювати нагадування, дізнаватися плани, ставити лічильники, слухати новини, виконувати взагалі будь-які команди і скрипти, не беручи в руки телефон! При цьому діалог теж підтримується.

А що ж ще?

Модуль «Диктування» дозволить просто продиктувати будь-який текст, який тут же буде вставлений в поле введення відкритої в даний момент програми.

Наприклад, можна писати пошукові запити у вікні браузера, диктувати текст в текстовому редакторі, писати повідомлення в месенджерах і багато іншого.

Подивіться на відео, як я просто сказав «Дуся агрегат», коли курсор стояв в поле введення текстового запиту на сайті youtube.com.

Як ним користуватися?

Легко! Так само, як і у Дусі, у Агрегату є способи активації, розпізнавання і синтез мови.

Найпростіший спосіб активувати Агрегат і дати команду - це просто затиснути пару гарячих клавіш на клавіатурі, вимовити команду і відпустити клавіші. При цьому можна робити паузи - Агрегат буде слухати вас, поки ви не відпустите кнопки!

Розпізнавання, синтез і активації - це теж модулі Агрегату, які можуть бути різними

Як він виглядає?

Згадаймо ті славні часи, коли і у Дусі не було ніякого інтерфейсу крім налаштувань.

Для комп'ютерної версії голосового асистента це набагато важливіше. Тому що ви можете користуватися його функціями, не відкриваючи інше додаток, не відволікаючись від поточної роботи. Нічого не займає екран. Агрегат просто слухає вас і виконує команди. Швидко і чітко!

Хочу! Як його встановити?

Зараз Агрегат знаходиться на стадії раннього альфа-тестування. Тому він доступний тільки для ентузіастів і програмістів, які завжди прагнуть опинитися на передньому краї технологій.

Альфа-тестування відкрите. Тобто будь-хто може вступити в спеціальне співтовариство Google+ і відправити заявку на отримання копії свого Агрегату.

У співтоваристві можна задавати будь-які питання і обговорювати їх. Документація по проекту і Керівництво Пользвоателя вже готові в першому варіанті і доступна в репозиторії GitHub. Там же розповідається в подробицях, де скачати модулі, як їх налаштувати і як ними користуватися.

Там же доступні модулі, їх опис та вихідні коди (для тих, хто бажає приєднатися до проекту і стати співавтором першого в світі голосового асистента з відкритим кодом).

Створи свій Агрегат!

Я сподіваюся, що вам сподобається наш новий проект, в якому кожен може взяти участь як співавтор. І ви побачите, що тільки справжня свобода дає необмежені можливості вашій уяві зі створення свого власного голосового асистента під ПК!

Чи не хотіли б ви спробувати управляти вашим комп'ютером за допомогою голосу? Typle - це програма, яка ідеально підходить для цієї мети. Ви отримаєте можливість налаштувати ваш комп'ютер повністю під себе, здійснюючи управління ним без використання периферійних пристроїв. Обмежень на кількість команд в Typle немає. Робота з утилітою відбувається наступним чином: ви вибираєте файл, вказує, що необхідно зробити з ним і під час записування голосових команду. Коли утиліта почує голосову команду, вона негайно зробить потрібну дію. І не важливо, ця команда повинна відкривати певний сайт в браузері, відтворювати плейлист або пісню, або ж запускати програму. Все на ваш розсуд, можливості не обмежені. Розпізнавання голосу в Typle реалізовано на високому рівні.

Наприклад, потрібно перейти за посиланням в браузері. У верхньому меню виберіть функцію «додати». Перед вами з'явиться вікно, в якому необхідно буде вибрати файл або програму. Натиснувши кнопку «додатково», ви зможете вибрати сам файл, записати для нього команду (наприклад «відкрити хром») і зберегти. Далі варто перевірити роботу команди. Натисніть «почати говорити» в програмі і скажіть команду. Інтерфейс доброзичливий і повністю настроюється. Якщо ви забули існуючу команду, то її можна переглянути і відредагувати в разі потреби.

Взаємодіяти з комп'ютером можна не тільки за допомогою клавіатури і миші. Доступно також управління голосовими командами. існують спеціальні утиліти , Які дозволяють це зробити. У їх функції входить не тільки запис тексту під диктовку або розшифровка аудіозаписів. Через них можна запускати додатки, використовувати їх, та й взагалі - робити що завгодно. Управління комп'ютером голосом полегшує роботу з ПК. Команди передаються оперативно і без зайвих зусиль. Звичайно, якщо у вас є мікрофон.

Ми познайомимо вас з додатками з подібним функціоналом

Така функція вбудована в англомовну версію Windows . Для її використання у вас повинна бути ліцензія Enterprise або Ultimate. Але і в русифікованих операційних системах можна налаштувати управління голосом і диктовку тексту. Скористайтеся одним з наступних програм.

Скористайтеся одним з наступних програм

З додатком розібратися нескладно

Популярна програма. Хоча і має свої недоліки. Суть її роботи проста: задаєте команду і вибираєте, яку дію вона повинна виконувати. Розглянемо налаштування цієї програми на конкретному прикладі.

Завантажити та встановити його. Є безкоштовна і Premiun версія. Другу треба купувати, щоб випробувати її на комп'ютері.
Запустіть утиліту. У ній з'явиться інформаційне вікно з підказками.
На її панелі управління є багато різних функцій. Деякі - з однаковими назвами. Треба орієнтуватися по картинці, а не по напису. Натисніть кнопку «Додати» - на ній зображено обличчя.
Задайте ім'я профілю і ключове слово, яке буде означати команду. Наприклад, напишіть «відкрити», якщо збираєтеся налаштувати запуск якогось додатку голосом. Або «перейти на", щоб миттєво перейти на якийсь сайт, не вводячи його адресу.
Тепер треба записати цю саму команду у вигляді звукового образу. Натисніть на кнопку з червоним кружком. І чітко, виразно скажіть в мікрофон потрібну фразу.
Підтвердіть зміни. Задана опція з'явиться в списку у вікні Typle. Програма запам'ятає те, що ви записали на її «диктофон».
Після цього вкажіть, що, власне, їй запускати для виконання команди. Натисніть кнопку «Додати», яка схожа на руку з символом «+» (плюс).
Виберіть формат даних: файли / утиліти, інтернет-сторінки, якісь внутрішні сервіси ОС. Поставте «галочки» там, де вам потрібно.
Знайдіть той додаток, що хочете запускати голосом. Нехай це буде, наприклад, Microsoft Word. Так ви зможете дуже швидко приступити до редагування якогось тексту або написання статті.
У тому ж вікні запишіть другу частину команди. Щоб в сумі вийшло «відкрити Ворд». Перше слово буде активувати Typle, друге - включати прив'язану утиліту.
Натисніть «Додати».
До однієї функції «відкрити» можна причепити кілька додатків. Так ви будете керувати їх запуском, не торкаючись до миші і іншим периферійних пристроїв, встановленим на комп'ютері.
Якщо треба, треба редагувати додаткові параметри.
Щоб перевірити, вийшло чи ні, натисніть на «Почати говорити» і скажіть команду.

Програма працює з російською мовою. Але не завжди правильно його розпізнає. Говорити треба голосно, чітко, механічним голосом.

Не потрібні знання англійської.
Швидке створення команд.

Немає розпізнавання тексту.
Обмежений функціонал. Можна лише відкривати утиліти і сторінки в інтернеті.
Програма іноді сприймає сторонні шуми як команди. Через це на ПК відбуваються дивні речі.
Не можна працювати з плеєром.

Speechka

Ще один додаток для управління комп'ютером

При першому запуску відкриється вікно з вибором категорії: ПК або інтернет.
Там же є пояснення, яким поєднанням клавіш треба активувати утиліту. Це можна змінити в настройках.
Натисніть, наприклад, на «Інтернет». Відкриється вікно з декількома полями для введення: для тексту команди і для URL сайту. Можна написати слово «Яндекс» і адреса цієї сторінки.
Натисніть «Додати».
Затисніть клавіші, зазначені на головному вікні.
Вимовте команду, щоб утиліта її «запам'ятала».

Активація як клавішами, так і по гучності звуку.
При запуску можна відкалібрувати мікрофон.

Обмежений функціонал.

Speaker

Інтерфейс виконаний в мінімалістичному ключі

Команди в додатку настроюються за допомогою друкованих слів, а не диктування. Є внутрішній механізм розпізнавання тексту. Основні функції:

Створення скріншотів по команді.
Зміна розкладки клавіатури на комп'ютері.
Відкриття додатків і файлів.
Завершення роботи.

Можна не робити аудіозапис з командою. Утиліта розпізнає написи.

Для управління треба використовувати клавіатуру. Якщо задана кнопка використовується і для інших цілей - буде незручно.
Потрібно стабільне інтернет-з'єднання.

Горинич

Герой російських народних казок допоможе вам

Програма для управління комп'ютером голосом «Горинич» - вітчизняний продукт. Тому там «рідний» модуль розпізнавання мови. Він «пристосовується» до тембру і інтонацій користувача. З утилітою можна повноцінно працювати в системі, а не просто відкривати файли і веб-сторінки.

Є підтримка російської та англійської мов.
Розпізнавання тексту, голосове введення в будь-редактори.
Розширений функціонал.

Треба самостійно створювати команди для кожного процесу. У буквальному сенсі доведеться записувати словник.

Windows Speech Recognition

Вбудована в англійську ОС програма. Для її використання у вас повинен бути встановлений відповідний мовний пакет. Російські команди з нею працювати не будуть. Щоб керувати ПК з її допомогою, доведеться говорити на її мові. Для отримання доступу до неї в Панелі налаштувань Windows відкрийте меню «Мова і регіональні стандарти» (воно знаходиться в категорії «Годинник, мова, регіон») і у всіх вкладках встановіть «Англійська». Якщо все правильно, і у вас встановлений необхідний мовний пакет, Windows «перетвориться» в англійську, і утиліта стане доступна. Краще не пробувати дані метод, якщо ви погано знаєте чужу мову.

Даний спосіб підійде в тому випадку, якщо ви володієте англійською

Інші утиліти

Є ще ряд додатків для управління такими командами:

Розширення для браузерів. Полегшують серфінг по мережі. У Google Chrome вже вбудована подібна функція - голосове введення в пошукові форми. Ця опція є на деяких онлайн-картах. Вона дозволяє швидше знайти адресу.
VoiceType.
RealSpeaker.
Web Speech.

Список програм для розпізнавання тексту і записи під диктовку

Управляти голосом - це, звичайно, добре. Але можуть виявитися корисними утиліти для розпізнавання тексту і друку під диктовку. При складанні об'ємних доповідей, дипломів легше записувати свої думки, озвучуючи їх в мікрофон на комп'ютері. Ось кілька таких утиліт:

Диктограф.
Dragon Naturally Speaking.
Перпетуум-Мобиле.

Перпетуум-Мобиле

Продукт, що дозволяє диктувати текст комп'ютеру

В ОС можна налаштувати голосові команди. Для цього на комп'ютері повинна бути встановлена відповідна програма. З нею ви зможете працювати на ПК, лежачи на дивані або розвалившись у кріслі. У вас будуть вільні руки. Якщо мікрофон хороший і вловлює навіть віддалені або тихі звуки, вам не потрібно поруч з ним сидіти. Ви можете одночасно «розмовляти» з комп'ютером і записувати конспект в зошиті, малювати, тримати щось. Та хоч шити і в'язати. З командами взаємодіяти з ПК набагато легше. Для активації деяких подібних утиліт потрібно натискати кнопки на клавіатурі, що не дуже зручно.

Але є і негативні аспекти. Якщо ви випадково скажете слово-команду, відкриється абсолютно не потрібне зараз додаток або оглядач не до місця перейде на якийсь сайт. Чим користуватися і чи користуватися взагалі - вирішувати вам.

Схожі статті

Як ним користуватися?
Як він виглядає?
Як його встановити?
Чи буду я звучати і виглядати смішно?
Чи буду діставати своїх друзів, відповідаючи на текстові повідомлення в громадських місцях, розмовляючи з телефоном?
Немає команди на дію, яке хочете зробити?
Що ж він вміє робити?
Схоже на Скрипти в Дусі, чи не так?
А що ж ще?
Як ним користуватися?

Новости

Голосове управління клавіатурою. Я користувався диктуванням і управлінням голосом тиждень і ось що вийшло

Історія розвитку голосового управління

Можливості Cortana і голосового введення на сьогоднішній день

сторонні програми

Typle

Speaker

Laitis

Можливості управління голосом через Яндекс.строку

Навіщо я зв'язався з диктуванням взагалі

День перший: навчання

День другий: настройка і використання мовних сервісів на комп'ютері

День п'ять: нарешті, голосове управління стало зручним

День сьомий: прийняття факту і повернення клавіатури

Що таке Агрегат

Знайомтеся - Агрегат

Що ж він вміє робити?

Інтеграція з Дусею

А що ж ще?

Як ним користуватися?

Як він виглядає?

Хочу! Як його встановити?

Створи свій Агрегат!

Speechka

Speaker

Горинич

Windows Speech Recognition

Інші утиліти

Список програм для розпізнавання тексту і записи під диктовку