Голосовой набор в word. голосовой ввод текста в редакторе ворд
Содержание:
- Как набирать текст в Word голосом
- ТОП программ и онлайн-сервисов для голосового набора текста
- Синтезатор речи (TTS)
- Онлайн сервисы для набора текста голосом
- Без ограничений не обошлось
- Использование распознавания речи в Windows
- Плюсы и минусы набора при помощи голоса
- Онлайн-синтезаторы
- Как набирать текст в Word голосом
Как набирать текст в Word голосом
Впрочем, это не совсем так. Не так давно компания выпустила расширение с говорящим названием Microsoft Dictate, позволяющее набирать тексты в Word голосом, но оно не идет ни в какое сравнение с голосовым движком Google. Если вы хотите реализовать голосовой ввод в Word, придется поискать более эффективные инструменты или, в крайнем случае, отказаться от голосового набора в Microsoft Word в пользу онлайнового текстового редактора Google Docs, в котором эта функция действительно работает.
Microsoft Dictate
Как уже было сказано, это не самый лучший и эффективный способ реализации голосового ввода в Microsoft Word. Скачав с сайта разработчика https://dictate.ms/
и установив модуль Microsoft Dictate, вы сможете набирать в Word лишь английские тексты, да и то не самого лучшего качества. После установки расширения на панели инструментов приложений Microsoft Office появится вкладка Dictation,
где вы сможете активировать распознавание голоса и выбрать язык.
В настоящее время приложение поддерживает ввод с 20-и языков и перевод с более чем 60-и языков, но, похоже, русский в эту двадцатку не входит. Набирать голосом вы сможете только английские тексты, если же попробуйте сделать это на русском, то получите полную несуразицу. К тому же приложение Dictate использует тот же языковой движок, что и Cortana, а как известно, последний не так хорош, как голосовой движок Google. В общем, проведя ряд тестов с приложением, мы были вынуждены отложить Dictate в долгий ящик и перейти к более эффективному инструменту.
Голосовой блокнот
В интернете по адресу speechpad.ru есть замечательный отечественный инструмент под названием «Голосовой блокнот», использующий для распознавания голоса алгоритмы Google. Позиционируется он как веб-сервис, но также предлагает возможность интеграции непосредственно в операционную систему для последующего ввода текста голосом в сторонних приложениях, в том числе и Microsoft Word. Чтобы получить возможность набирать в редакторе голосом, вам нужно будет зарегистрироваться на сайте разработчика,
установить расширение Голосового блокнота для Chrome, скачать со странички https://speechpad.ru/blog/windows-integration/ модуль интеграции и установить его, запустив командный файл install_host.bat.
Затем, авторизовавшись на сайте и зайдя в личный кабинет пользователя, включить тестовый период. Далее на страничке speechpad.ru нужно установить флажок «Интеграция с ОС» и включить запись.
После этого в приложениях должен стать доступен голосовой текстовый ввод. Никаких всплывающих окон и кнопок Голосовой блокнот не выводит, просто начинаем диктовать текст в том же Word или другом приложении. Главное, чтобы браузер был запущен, и кнопка записи включена.
Инструмент на наш взгляд вполне достойный, но за его использование придется платить порядка 100 рублей в месяц, такова установленная его создателем такса.
Google Documents
Сервис Google Documents не имеет прямого отношения к Microsoft Word, будучи продуктом иной компании, но он может стать отличной альтернативой для тех пользователей, которым нужен качественный инструмент голосового набора. Здесь всё проще простого: создайте новый или откройте уже существующий документ, перейдите в меню Инструменты —> Голосовой ввод,
нажмите появившуюся иконку микрофона и начинайте диктовать.
Возможно, Google Documents не так удобен и функционален как Microsoft Word, но зато с голосовым вводом в нём у вас не будет проблем и это тем более, что никаких модулей в систему устанавливать не придется.
ТОП программ и онлайн-сервисов для голосового набора текста
Современные технологии голосового ввода и вывода информации предоставляют пользователям массу возможностей для облегчения работы и экономии времени. Никого уже не удивит ни программа для превращения текста в голос, ни та, что набирает вместо вас всё то, что вы произносите. Развиваться в данном направлении ещё есть куда, но и на сегодняшний день можно найти вполне достойные сервисы и софт для речевого общения с компьютером. Системы распознавания речи оцифровывают звук, поступающий с микрофона, и идентифицируют информацию, обращаясь к имеющимся словарям (софт может поддерживать разные языки и иметь большой словарный запас), после чего выводят на экран уже напечатанный текст или задают различные команды.
ТОП программ для голосового набора текста.
Технология активно применяется на смартфонах, планшетах и других девайсах, где могут по умолчанию присутствовать программы, «понимающие» язык пользователя, что очень удобно в управлении. Продвинутым пользователям давно не в новинку вместо набора команд, запросов в поисковой строке браузера с клавиатуры использовать речь. Но прогресс не стоит на месте и обычным делом становится также преобразование голоса в текст в более существенных объёмах. Применение специальных программ, расширений браузера и онлайн-сервисов для речевого ввода данных позволяет частично освободить руки и не напрягать зрение, а также выполнять задачи быстрее. Это неоценимо для представителей многих профессий, в числе которых юристы, врачи, писатели, копирайтеры и прочие специалисты, работающие с набором текстов.
Несмотря на тот факт, что обычно люди, которые много пишут, делают это достаточно быстро и скорость печати вполне поспевает за мыслью, часто действительно есть смысл использования программы. Набор текста голосом выручит, если по каким-либо причинам неудобно печатать вручную, руки заняты другими делами или могут уставать от долгой работы. Также не стоит забывать и о людях с ограниченными возможностями – для них такие инновации просто спасение. С другой стороны, отнюдь не все владеют «методом слепого набора», не печатают в нужном темпе или просто ленятся. Многие писатели, журналисты и другие деятели на протяжении десятилетий использовали диктофон, чтобы быстрее наговорить нужный текст и не дать мысли ускользнуть. С этой же целью сегодня применяются программы для набора текста голосом.
Конечно, преобразование надиктованной информации в печатный вариант ещё не на самом высоком уровне. После того, как программа переведёт голос в текст, обязательно потребуется его корректировка, поскольку некоторые слова могут отсутствовать в словарях софта, а также по причине неправильно расшифрованных устройством фраз, что может быть связано с работой микрофона или нечётким произношением. Технологии пока не так совершенны, ведь на разработки требуются немалые вложения капитала, но сдвиги определённо есть. Дальше всех в этой области продвинулась компания Google, которая выпускает многочисленные программные продукты, в том числе приложения для записи и преобразования голоса в текст.
Синтезатор речи (TTS)
Для всех пользователей портала виртуальных офисных инструментов мы ввели бесплатную поддержку современной технологии синтеза речи text-to-speech. Это технология нового поколения, позволяющая генерировать речь напрямую из печатного текста. То есть набранный вами текст может быть произнесен любым выбранным вами голосом, с нужной вам интонацией и скоростью речи.
Каким же способом это происходит и что из себя представляет технология text-to-speech?
Технология text-to-speech сокращенно (TTS) способна формировать любую форму речи (голос или просто речевой сигнал) по простому печатному тексту. Иными словами — это синтез голоса, настолько хорошо генерированный современными программами, что их просто невозможно отличить от настоящего человеческого голоса.
На сегодняшний день text-to-speech является лучшей технологий, способной преобразовывать текст в речь. Причем это могут любые голоса от самых низких мужских до высоких женских и даже роботизированных голосов на нескольких языках.
Основными преимуществами использования этой технологии являются конвертирование и чтение файлов без временных файлов, что способствует экономии места на жестком диске и очень быстрой, почти мгновенной скорости
конвертирования. Кроме того существует возможность поддержки функции МР3 качества и шрифтовых настроек. Очень быстрая скорость работы и удобный пользовательский интерфейс.
Использование технологии синтеза речи
В каждом разделе личного кабинета для управления виртуальной АТС есть кнопка TTS, которая позволяет использовать голосовой движок.
Для того, чтобы сконвертировать текст в речь, нужно зайти в раздел Автоинформатор \ Звуковые файлы и нажать на кнопку «добавить». В появившемся окне нажать кнопку TTS и вставить нужный текст. Затем, указав его идентификатор и описание, нажать кнопку «ОК».
Скачать пример работы функции TTS
Вы можете убедиться в безупречности работы нашего голосового движка для различных услуг виртуальной АТС. Для этого скачайте примеры сгенерированных файлов по ссылкам ниже. Первый пример — это голосовое меню с поддержкой Text to Speech, русский мужской и женский голос.
Скачать голосовое приветствие мужской голос |
Скачать голосовое приветствие женский голос |
Второй пример — автоматически сгенерированное сообщение уведомления о текущем балансе для телефонного автоинформатора с поддержкой Text to Speech, русский мужской и женский голос.
Скачать автоинформатор мужской голос |
Скачать автоинформатор женский голос |
Поддержка программного интерфейса API Text to Speech
Специальная веб-служба виртуальной АТС поддерживает открытый программный интерфейс API для интеграции голосового движка в приложения телефонии. Самым наглядным примером использования связки телефон и синтез речи — это услуга автоинформатор. Автоинформатор позволяет генерировать текстовые сообщения по маске и POST-запросам, конвертировать их в голос и в автоматическом режиме передавать по телефонным линиям. Ниже представлена ссылка на подробное описание услуги и программного интерфейса TTS.
Онлайн сервисы для набора текста голосом
На данный момент есть очень большой выбор сервисов и программных приложений для голосового набора команд и управления.
Голосовой блокнот speechpad.ru
Преимущества:
Для использования онлайн версии следует перейти на сайт https://speechpad.ru/, пролистать страницу вниз, включить запись и получить готовый текст. Для браузера потребуется скачать и установить расширение.
Инструкция по использованию:
- Кликните по кнопке «Включить запись». (если Вы первый раз это делаете, то в правом верхнем углу возникнет всплывающее уведомление о том, что нужно разрешить доступ сервису к микрофону).
- Постарайтесь как можно четче и ближе к микрофону произносить слова. Стоит учитывать, что проговариваемый текст будет появляться там, где находится курсор. А если случайно перед этим был выделен текст, то он затрется.
- Можно активировать опцию «Отключить управление заглавными буквами» и тогда Google не будет обновлять регистр в зависимости от пунктуации. А для изменения необходимо будет воспользоваться кнопкой с текстом А/а, она увеличит или уменьшит размер той буквы рядом с курсором.
- Для удаления действия нужно нажать кнопку «Отменить».
- Для расстановки знаков препинания есть специальные кнопки на панели, активировать кликом левой кнопки мыши. Также Вы можете отметить для использования функцию «Заменять слова пунктуации» и тогда сможете голосом расставлять знаки препинания.
- Для того, чтобы поменять язык, необходимо нажать на данное поле и появится выпадающий список, в котором следует найти и выбрать требуемый. При условии, что нет нужного, необходимо зарегистрироваться и добавить в личном кабинете.
- Чтобы давать команды сервису при помощи голоса, активируйте пункт «Выполнять команды».
- Также вывод текста можно делать не только в поле на сайте сервиса, но и в буфер обмена после выбора использования такой функции на странице и установке расширения для блокнота.
Голосовой ввод текста в Гугл документах
Преимущества и возможности:
- Запись, редактирование и форматирование информации голосом.
- Удобство: нет необходимости устанавливать программу на устройство.
- Мультиязычность.
Пошаговая инструкция применения:
- Перейти в браузере в раздел «Инструменты».
- Откройте из предложенных пунктов «Голосовой ввод».
- Активируйте кликом иконку микрофона (разрешите использование).
- Начинайте громко и четко произносить то, что следует записать.
Расширение для браузера Войснот II
Достоинства:
- Удобство.
- Интуитивно понятный интерфейс: достаточно простое управление.
- Есть возможность создать ярлык для быстрого доступа к сервису.
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
- Сохранение информации в браузере, кэше, буфере обмена.
Инструкция использования:
- Установка:
- Перейти в магазин расширений Google: http://goo.gl/oMx8Xx;
- Установить и разрешить использование микрофона.
- Создание ярлыка на рабочем столе:
- Перейти на страницу расширений, которые установлены.
- Нажать на иконку Войснот.
- Выбрать в появившемся меню «Создать ярлык».
- Запуск/остановка:
- Нажать на кнопку с изображением микрофона.
- Или активировать сочетание клавиш Ctrl+Пробел.
- Запись текста предполагает расставление знаков препинания с учетом правил русского языка и пауз в процессе диктовки.
- Чтобы отредактировать, следует воспользоваться панелью инструментов: стереть, сохранить, скопировать, исправить регистр букв, добавить недостающие знаки пунктуации, перейти на новую строку.
Распознавание речи в браузере TalkTyper
Преимущества:
- Бесплатный сервис;
- Мультиязычность.
- Исправление написания слов при нечетком или неправильном произношении.
Инструкция:
Голосовой блокнот August4u
Достоинства:
- Простота использования.
- Является уникальной разработкой.
- Высокий уровень качества и скорости распознавания.
- Использовать можно бесплатно.
Инструкция:
- Перейти на страницу сервиса: https://august4u.net/?speech2text.
- Можно выбрать один из 6 языков.
- Нажать на иконку микрофона и разрешить доступ к устройству.
- Автоматически включена расстановка знаков препинания, но нажав на кнопку с текстом «.,!» можно отключить данную функцию.
- По окончании диктовки можно сохранить, копировать, отправить на электронную почту полученный текст и очистить поле, нажав на иконку с крестиком.
Без ограничений не обошлось
Пример работы Word Transcribe
Однако самое серьезное ограничение связано с длительностью распознаваемых диалогов, что пока исключает Transcribe из списка инструментов тех, кто профессионально занимается переводом (транскрибирования) аудиозаписей разговоров в текст. Word может расшифровать не более пяти (5) часов диалогов, притом в месяц.
Грузовые дроны и воздушные такси: какой будет Москва будущего
Инновации и стартапы
Обойти это ограничение пока никак нельзя. Даже нет возможности купить дополнительные часы за деньги, как и научить Word работать с файлами весом свыше 200 МБ.
Использование распознавания речи в Windows
Просмотрите это видео об использовании распознавания речи для работы с компьютером. (Чтобы просмотреть субтитры, нажмите кнопку «Субтитры».)
Просмотрите это видео об использовании диктовки с распознаванием речи. (Чтобы просмотреть субтитры, нажмите кнопку «Субтитры».)
Распознавание речи Windows делает использование клавиатуры и мыши необязательным. Вместо этого теперь можно управлять компьютером с помощью голоса и диктовать текст для ввода.
Примечание: Распознавание речи доступно только для следующих языков: английский (США и Соединенное Королевство), французский, немецкий, японский, мандаринский диалект (китайский (упрощенное и традиционное на китайском языке) и испанский.
Прежде чем использовать распознавание речи, необходимо выполнить несколько действий. Сначала нужно настроить микрофон. Затем можно научить компьютер распознавать ваш голос.
Прежде чем приступить к настройке функции распознавания речи, убедитесь, что микрофон подключен к компьютеру, иначе настройка не удастся.
Выполните прокрутку от правого края экрана и нажмите кнопку Поиск. (Если вы используете мышь, найдите правый нижний угол экрана, переместите указатель мыши вверх и нажмите кнопку «Поиск».)
Поиск также можно открыть с помощью клавиатуры, нажав клавиши Windows+Q.
Введите в поле поиска настройка микрофона, а затем выберите элемент Настройка микрофона.
Следуйте указаниям на экране.
Примечание: По возможности используйте микрофон гарнитуры — это снижает вероятность фонового шума.
Обучение компьютера распознаванию речи
Программа распознавания речи использует особый речевой профиль для распознавания голоса пользователя и произносимых команд. Чем дольше вы пользуетесь распознаванием речи, тем более подробным становится ваш речевой профиль и тем лучше компьютер интерпретирует ваши команды.
Выполните прокрутку от правого края экрана и нажмите кнопку Поиск. (Если вы используете мышь, найдите правый нижний угол экрана, переместите указатель мыши вверх и нажмите кнопку «Поиск».)
Поиск также можно открыть с помощью клавиатуры, нажав клавиши Windows+Q.
Введите в поле поиска распознавание речи, а затем коснитесь элемента Распознавание речи или щелкните его.
Нажмите или щелкните элемент Обучить компьютер для улучшения распознавания вашего голоса.
Следуйте инструкциям по настройке речевого ввода для распознавания речи.
При помощи голосовых команд можно выполнять многие задачи, например заполнять электронные формы или писать письма. Когда вы произносите слова в микрофон, программа распознавания речи преобразует их в текст, который отображается на экране.
Диктовка текста с помощью программы распознавания речи
Выполните прокрутку от правого края экрана и нажмите кнопку Поиск. (Если вы используете мышь, найдите правый нижний угол экрана, переместите указатель мыши вверх и нажмите кнопку «Поиск».)
Поиск также можно открыть с клавиатуры, нажав клавиши Windows +Q.
Введите в поле поиска распознавание речи, а затем коснитесь элемента Распознавание речи Windows или щелкните его.
Произнесите команду «Start listening» либо коснитесь кнопки микрофона или нажмите ее, чтобы войти в режим прослушивания.
Плюсы и минусы набора при помощи голоса
Плюсы:
- Благодаря этим приложениям, фрилансеры могут хорошо подзаработать, занимаясь транскрибацией. Множество заданий такого рода можно найти на бирже Work-zilla, – это излюбленное место новичков в удалённой работе. Вам только остаётся включить программу и чуть позже подкорректировать текст в Word.
- Экономия времени и сил.
- Отличная находка для людей с ограниченными возможностями.
- Для творческих людей выше предложенные сервисы – палочка-выручалочка, все идеи можно быстро записать, просто озвучив голосом, чтобы не забыть.
К сожалению, существуют и минусы при работе с данными сервисами:
- Если в помещении, где вы надиктовываете, есть посторонние звуки, то распознавание слов и словосочетаний в разы ухудшается.
- Многие приложения, работающие онлайн, доступны только в браузере Google Chrome.
- После набора нужно уделить время на редактирование и корректировку текста.
- Необходимо иметь качественный чувствительный микрофон.
- Желательно иметь хорошую дикцию, чтобы уменьшить риск возникновения ошибок.
Онлайн-синтезаторы
Acapela
Один из самых известных синтезаторов речи. Разговаривает на 30 языках. Текст на русском языке вам могут зачитать мужским голосом Николай, а женским – Алёна. На бесплатное использование есть ограничение: в браузерной версии можно воспроизвести не больше 300 символов. Для использования полного функционала необходимо скачать платную программу – она доступна на Windows, Linux, Mac, а также на мобильных OC Android и IOS.
Text-to-Speech
Синтезатор речи с продвинутыми настройками: можно задавать скорость речи, размер шрифта и машинный перевод. Доступна даже экранная клавиатура для людей с ограниченными возможностями. На русском текст может зачитать здесь только женский голос.
Oddcast
На этом портале вам тоже не дадут озвучить более 300 символов разом. Зато русский язык поддерживается тремя голосами: одним мужским (Дмитрием) и двумя женскими (Милиной и Ольгой). Но главная фишка портала в том, что текст вам зачитывают анимированные дикторы. За это можно простить программе даже не самый удобный интерфейс.
Linguatec
Как и в случае с Acapela, больше определенного количества символов (здесь – 250) бесплатная версия вам озвучить не разрешит. Но зато с этой задачей она справляется очень неплохо. Здесь так же доступны два голоса – мужской (Юрий) и женский (Милена).
Ispeech
Простейший бесплатный инструмент для озвучивания коротких текстов размером не больше твита – максимум 150 символов. Зато полученный результат можно сохранить на компьютере. Русский язык поддерживается.
PilliApp
Программа не разговаривает больше 60 секунд, поэтому разработчики рекомендуют делить длинный текст на несколько строк. За русский язык отвечают голоса Юрия и Елены. Сайт программы явно переведен в автоматическом режиме, поэтому не удивляйтесь легкой странности текста на главной странице.
2уха
Отечественный онлайн-софт с возможностью расширенных настроек: можно отрегулировать скорость чтения, высоту тона, громкость и чтение знаков препинания. Выбор невелик – только Александр или Елена. Зато можно не копировать текст в окошко, а сразу загрузить в программу файл Microsoft Word. Минус этого сервиса в том, что мгновенно озвучить текст не получится: придется подождать в очереди на конвертацию.
Как набирать текст в Word голосом
Впрочем, это не совсем так. Не так давно компания выпустила расширение с говорящим названием Microsoft Dictate, позволяющее набирать тексты в Word голосом, но оно не идет ни в какое сравнение с голосовым движком Google. Если вы хотите реализовать голосовой ввод в Word, придется поискать более эффективные инструменты или, в крайнем случае, отказаться от голосового набора в Microsoft Word в пользу онлайнового текстового редактора Google Docs, в котором эта функция действительно работает.
Microsoft Dictate
Как уже было сказано, это не самый лучший и эффективный способ реализации голосового ввода в Microsoft Word. Скачав с сайта разработчика https://dictate.ms/
и установив модуль Microsoft Dictate, вы сможете набирать в Word лишь английские тексты, да и то не самого лучшего качества. После установки расширения на панели инструментов приложений Microsoft Office появится вкладка Dictation,
где вы сможете активировать распознавание голоса и выбрать язык.
В настоящее время приложение поддерживает ввод с 20-и языков и перевод с более чем 60-и языков, но, похоже, русский в эту двадцатку не входит. Набирать голосом вы сможете только английские тексты, если же попробуйте сделать это на русском, то получите полную несуразицу. К тому же приложение Dictate использует тот же языковой движок, что и Cortana, а как известно, последний не так хорош, как голосовой движок Google. В общем, проведя ряд тестов с приложением, мы были вынуждены отложить Dictate в долгий ящик и перейти к более эффективному инструменту.
Голосовой блокнот
В интернете по адресу speechpad.ru есть замечательный отечественный инструмент под названием «Голосовой блокнот», использующий для распознавания голоса алгоритмы Google. Позиционируется он как веб-сервис, но также предлагает возможность интеграции непосредственно в операционную систему для последующего ввода текста голосом в сторонних приложениях, в том числе и Microsoft Word. Чтобы получить возможность набирать в редакторе голосом, вам нужно будет зарегистрироваться на сайте разработчика,
установить расширение Голосового блокнота для Chrome, скачать со странички https://speechpad.ru/blog/windows-integration/ модуль интеграции и установить его, запустив командный файл install_host.bat.
Затем, авторизовавшись на сайте и зайдя в личный кабинет пользователя, включить тестовый период. Далее на страничке speechpad.ru нужно установить флажок «Интеграция с ОС» и включить запись.
После этого в приложениях должен стать доступен голосовой текстовый ввод. Никаких всплывающих окон и кнопок Голосовой блокнот не выводит, просто начинаем диктовать текст в том же Word или другом приложении. Главное, чтобы браузер был запущен, и кнопка записи включена.
Инструмент на наш взгляд вполне достойный, но за его использование придется платить порядка 100 рублей в месяц, такова установленная его создателем такса.
Google Documents
Сервис Google Documents не имеет прямого отношения к Microsoft Word, будучи продуктом иной компании, но он может стать отличной альтернативой для тех пользователей, которым нужен качественный инструмент голосового набора. Здесь всё проще простого: создайте новый или откройте уже существующий документ, перейдите в меню Инструменты –> Голосовой ввод,
нажмите появившуюся иконку микрофона и начинайте диктовать.
Возможно, Google Documents не так удобен и функционален как Microsoft Word, но зато с голосовым вводом в нём у вас не будет проблем и это тем более, что никаких модулей в систему устанавливать не придется.
Голосовой ввод текста в редакторе Word – очень удобный и продвинутый инструмент. Но о нём знают не многие. Это не удивительно, поскольку технология была запущена относительно недавно: 27 июня 2017 года на официальном сайте Microsoft появилась новость, в которой они сообщили о новой возможности.