Сервис 1С: Распознавание речи

В чем помогает сервис?

1С: Распознавание речи предоставляет удобное решение для ввода текста голосом, что может быть особенно полезно в ситуациях, когда длинный текст проще надиктовать, чем вводить его на клавиатуре.

С помощью этого инструмента пользователи могут легко вводить содержание электронных писем, описывать задачи и добавлять комментарии, а также вводить текстовые блоки в документах, используя свой голос. Это особенно удобно, когда руки пользователя заняты или при работе на мобильных устройствах, где ввод текста с клавиатуры может быть неудобным.

Распознавание речи осуществляется автоматически, и программа преобразует произнесенные слова в текст. Таким образом, пользователи могут значительно сэкономить время и усилия, используя голосовой ввод для создания и редактирования текстовых данных.

1С: Распознавание речи предоставляет эффективный инструмент для повышения продуктивности работы с текстом, основанного на голосовом вводе. Он делает процесс ввода информации более естественным и удобным, что позволяет пользователям более эффективно выполнять свои задачи и сосредоточиться на более важных аспектах своей работы.

Совещания и разговоры в 1С

С использованием решения также возможно распознавание записей телефонных звонков или совещаний при условии хорошего качества аудиозаписи. Однако для достижения наилучшего результата рекомендуется вести запись с разделением на отдельные звуковые каналы для каждого собеседника.

Распознавание речи при записи телефонных звонков или совещаний может быть очень полезным в различных ситуациях. Можно сохранять аудиозаписи для дальнейшего анализа, восстановления деталей или использования в качестве доказательств в юридических или деловых вопросах.

Для достижения наилучших результатов и точности распознавания, рекомендуется обеспечить хорошее качество аудиозаписи. Это включает использование высококачественного звукового оборудования и программ, а также обеспечение минимального уровня шума и искажений в записях.

Голосовые команды

С помощью функциональности голосового управления в приложениях, пользователи могут давать голосовые команды для выполнения различных задач. Они могут использовать голосовое управление для открытия нужных форм, генерации отчетов, выполнения поиска или заполнения реквизитов.

При использовании голосового управления, пользователь может произнести команду или вопрос вслух, а затем приложение распознает его речь и выполняет соответствующие действия. Пользователь может сказать: «Открой форму создания нового заказа» или «Сгенерируй отчет за прошлую неделю».

Голосовое управление может значительно упростить и ускорить работу с приложениями, особенно в случаях, когда пользователю неудобно или невозможно использовать клавиатуру или сенсорный экран. Оно позволяет сократить время на выполнение задач, повысить удобство использования и улучшить общую производительность.

1С: Распознавание речи предоставляет такую возможность голосового управления в приложениях, позволяя пользователям управлять процессами и выполнением операций с помощью голосовых команд.

Для чего можно использовать сервис 1С: Распознавание речи?

1С: Распознавание речи предоставляет широкий спектр возможностей для применения в различных сферах, связанных с голосовыми интерфейсами и обработкой речевой информации:

Роботизация звонков.

Проведение опросов и сбор информации. С помощью сервиса можно автоматизировать процесс совершения звонков и распознавания ответов абонентов. Это позволяет существенно упростить и ускорить сбор данных, снизить вероятность ошибок и повысить точность анализа полученных результатов.

Голосовые системы самообслуживания.

Пользователи могут взаимодействовать с такими системами, используя голосовые команды, чтобы получать информацию, выполнять определенные действия или задавать вопросы. Это создает более удобное и интуитивно понятное взаимодействие с системой, а также сокращает время обслуживания пользователей.

Речевая аналитика работы с клиентами.

Путем автоматического распознавания и анализа речи, система может оценивать эмоциональный фон, тональность и содержание разговоров с клиентами. Это позволяет более эффективно управлять взаимоотношениями с клиентами, выявлять проблемы и улучшать качество обслуживания.

Интерфейс для людей с ограниченными возможностями.

Голосовое управление позволяет людям, имеющим проблемы с моторикой или зрением, управлять приложениями и получать доступ к информации, используя свой голос. Это обеспечивает равные возможности и повышает доступность технологий для всех пользователей.

Потоковая обработка

В рамках потокового распознавания речи в программном продукте предусмотрена возможность работы с дополнительной грамматикой. Это означает, что пользователь может предварительно передать системе некоторые специфические термины, которые нужно уверенно распознавать в процессе распознавания речи.

Если пользователю необходимо распознавать фамилии сотрудников, названия товаров или компаний-контрагентов, нужно предварительно передать эти термины системе. Это позволяет системе иметь предварительный набор слов или фраз, которые она будет учитывать при распознавании речи. В результате, система будет более точно распознавать эти специфические термины и увеличивать качество распознавания в целом.

Дополнительная грамматика позволяет настроить систему на конкретные потребности и особенности бизнеса. Можно заранее предоставить список терминов, которые часто встречаются в деятельности, и система будет активно использовать их при распознавании речи. Это особенно полезно в случаях, когда имеется большой объем специфической терминологии, которую необходимо распознавать с высокой точностью.

Механизм использования

1С: Распознавание речи предоставляет два варианта для осуществления распознавания речи:

Облачный сервис.

В случае использования облачного сервиса аудиоданные отправляются на серверы компании «1С», где происходит процесс распознавания речи. Это удобно, так как не требуется дополнительное оборудование или вычислительные мощности на стороне пользователя. Облачный сервис обрабатывает и возвращает текстовый результат распознавания обратно пользователю. Это особенно полезно при больших объемах аудиоданных или если у пользователя ограничены вычислительные ресурсы.

Скачанная модель распознавания.

В случае локального использования, модель распознавания речи скачивается и устанавливается на локальное оборудование пользователя. Это означает, что аудиоданные не передаются на сторонние серверы, и весь процесс распознавания речи осуществляется локально. Этот вариант может быть предпочтительным, если у пользователя есть особые требования к защите конфиденциальных данных или если сетевое подключение ограничено.

Оба варианта имеют свои преимущества и выбор зависит от конкретных потребностей и ограничений пользователя. Облачный сервис упрощает реализацию распознавания речи и позволяет обрабатывать большие объемы данных без необходимости в дополнительном оборудовании. Локальное использование подходит, если защита данных или ограничения в сетевом подключении связаны с требованиями законодательства.

Развитие системы

Бренд 1С постоянно работает над совершенствованием и улучшением качества распознавания речи в своем продукте 1С: Распознавание речи. Новые функциональные возможности обычно впервые появляются в облачном режиме, где разработчики могут быстро внедрять и тестировать технологии.

Облачный вариант позволяет компании 1С оперативно обновлять и улучшать модели распознавания речи на своих серверах, что ведет к более точному и эффективному распознаванию речи.

После тщательного тестирования и утверждения новых функций и фишек они становятся доступными и в локальном варианте распознавания речи. Это означает, что клиенты, использующие локальные модели, могут применять новые возможности с улучшенным качеством после внедрения в локальное решение.

Важно отметить, что качество распознавания речи может отличаться между облачным и локальным вариантами из-за разницы в моделях и алгоритмах, используемых в каждом случае. Однако благодаря системе обновлений и интеграции новых функций, пользователи обоих вариантов получают доступ к улучшенным возможностям и повышенной точности распознавания речи по мере появления.

Компания «1С» предоставляет демо, доступ к которому можно получить, обратившись в офис компании «АйТи-Консалтинг», которое позволяет пользователям ознакомиться с механизмом распознавания речи. Данный вариант доступен в виде конфигурации 1С, которая интегрируется с платформой 1С: Предприятие 8. Оно предоставляет возможность распознавания речи из потокового аудио или звуковых файлов, задействовав как облачный сервис, так и локальную модель распознавания.

Демо демонстрирует реализованные функциональные возможности распознавания речи, которые могут быть использованы разработчиками для встраивания распознавания речи в свои прикладные решения на платформе 1С: Предприятие 8. Это означает, что разработчики могут изучить и заимствовать функциональность демо для создания собственных приложений или расширения уже существующих решений с возможностью распознавания речи.

Предоставление демо позволяет разработчикам ознакомиться с механизмами и возможностями распознавания речи в рамках платформы 1С, а также осуществить практические эксперименты и тестирование. Это способствует более эффективному внедрению и интеграции распознавания речи в различные бизнес-сценарии на базе технологической платформы.

Возможности сервиса

1С: Распознавание речи предлагает функциональность потокового распознавания речи, которая позволяет пользователям отправлять аудиоданные в режиме реального времени и получать периодически распознанный текст в ответ. Этот подход особенно удобен в ситуациях, когда необходимо диктовать текст или управлять интерфейсом программы с помощью голосовых команд.

При использовании облачного сервиса 1С: Распознавание речи для потокового распознавания имеется ограничение на длительность одного сеанса в 2 часа. Это означает, что пользователь может непрерывно передавать аудиоданные для распознавания в течение двух часов. Если сеанс превышает это ограничение, необходимо инициировать новый сеанс.

Однако при использовании локального варианта распознавания речи нет ограничений по длительности сеанса. Это означает, что пользователь может продолжать передавать аудиоданные для распознавания сколь угодно долго без ограничений времени.

Выбор между облачным и локальным вариантом потокового распознавания зависит от конкретных требований и предпочтений пользователя. Облачный сервис удобен в использовании и не требует наличия дополнительного оборудования, но имеет ограничение на длительность сеанса. Локальный вариант обеспечивает более гибкий контроль над данными и отсутствие ограничений длительности сеанса, но требует установки и настройки локальной модели распознавания речи.

Файловое распознавание

Файловое распознавание в 1С: Распознавание речи представляет собой процесс, при котором пользователь отправляет на распознавание аудиофайл, содержащий речь, и в ответ получает идентификатор задачи. С помощью этого идентификатора пользователь может в дальнейшем получить результат распознавания в виде текста.

При использовании файлового распознавания, пользователь может отправить готовый аудиофайл или запись совещания для обработки и распознавания. Результат распознавания будет предоставлен пользователю с некоторой задержкой, которая зависит от длительности аудиофайла и текущей загрузки облачного сервиса.

Файловое распознавание может обрабатывать многоканальные аудиозаписи. При этом каждый канал будет распознаваться и тарифицироваться независимо. Такой подход позволяет получить отдельные результаты распознавания для каждого канала и анализировать речь, записанную на разных каналах, по отдельности.

Для распознавания аудиофайлов в 1С: Распознавание речи принимаются форматы аудио WAV и Opus в контейнере ogg. Частота дискретизации аудио может быть в диапазоне от 8 кГц до 48 кГц. Эти форматы и параметры обеспечивают оптимальное качество распознавания речи.

Максимальный размер аудиофайла, который можно отправить на распознавание, составляет 1 Гб, и его длительность может быть до 4 часов. Если файл превышает указанные ограничения, необходимо разбить его на более мелкие части и отправить их на распознавание отдельно.

После выполнения задания по распознаванию, результаты становятся доступными для скачивания в течение 7 суток. Пользователь может получить распознанный текст и использовать его в своих прикладных решениях или аналитических целях.

Файловое распознавание в 1С: Распознавание речи предоставляет удобный способ обрабатывать и распознавать аудиозаписи с помощью облачного сервиса. Пользователи могут использовать эту функциональность для анализа речи, сбора информации и других прикладных задач, связанных с обработкой аудиоданных.

Языки

1С: Распознавание речи в настоящее время поддерживает распознавание речи на двух языках: русском и английском. Это означает, что пользователи могут отправлять на распознавание аудиоданные на этих языках и получать результаты распознавания в виде соответствующего текста.

Однако 1С активно работает над расширением списка поддерживаемых языков. В будущем планируется добавление новых языков, чтобы обеспечить большую гибкость и удовлетворить потребности пользователей, говорящих на различных языках.

Заказать звонок