Имя: Пароль:
1C
 
Распознавание и синтезатор речи
0 lEvGl
 
03.06.24
07:14
Доброго всем, у кого был опыт с этими средствами от 1С? Насколько адекватно распознает, нужно ли иметь дикторские способности, насколько это жизнеспособно? Спасибо за любую информацию
1 Волшебник
 
03.06.24
07:51
Применяются внешние движки
2 lEvGl
 
03.06.24
08:05
я видел, у них сервисы есть, для первого запуска к ним надо подключиться, он (видимо) выкачивает модель на локальный комп и потом позволяет без нэта уже работать, локально. Подходит такой вариант, вопрос в способности взаимодействия с людьми с несовершенным произношением русского языка, в идеале бы еще один из азиатских иметь, но пока хотя бы русский
если онлайн движки, то постоянный доступ нужен и время будет больше, несовсем то
по-другому вопрос: насколько сильные деффекты при произношении прощает обработчик
3 Волшебник
 
03.06.24
09:04
"с людьми с несовершенным произношением русского языка"

А где Вы видели людей с совершенным произношением русского языка?
Постоянно путают ударения, путают порядок слов, подменяют слова и смыслы, несут галиматью, сами не знают, что хотят сказать.
4 spiller26
 
03.06.24
09:08
Одно слово "зачем оно там?".
5 Волшебник
 
03.06.24
09:11
(4) Бывают бизнес-задачи по произнесению и распознаванию речи, например, терминалы самообслуживания покупателей в супермаркетах, вендинговые автоматы, взаимодействие с высшим руководством, которые лишний раз не хотят палец о кнопку ударять 🤟
6 lEvGl
 
03.06.24
09:17
(3) может будет кто то, кто практически юзал
(4) точно не от нечем заняться
7 lEvGl
 
03.06.24
12:13
апнем
8 Андрюха
 
03.06.24
12:20
(0) Распознавание делал на движке 1С, у них есть демо-конфигурация, можно потестить.
9 NorthWind
 
03.06.24
12:27
(4) полно задач где это полезно, особенно синтез. Дисплеи хрупки и дороги, а наушники или динамик стоят копейки. Можно делать всякого рода голосовые меню для поганых условий эксплуатации.
10 lEvGl
 
03.06.24
13:55
(8) добавил в самописку на бсп модель с русским, база сразу 2гБ памяти оторвала дополнительно, + грузит проц, через время после запуска отпускает. Дт стала весить на 1кБ больше, пользовательский режим запускается немного дольше, конф - без изменений.
(9) где-то так

пока итог: сильно (не то чтобы прям) страдают ресурсы, что и было обещано для локального использования

зы. не найду предметного материала по программной работе с этими объектами. демо есть, но там как всегда придется копаться через 3 езды колено, чтобы найти просто включение микрофона
11 Garykom
 
03.06.24
14:04
Еще бы распознавание текстов из сканов сделали
12 lEvGl
 
03.06.24
14:07
(11) + еще 2-3 Гб памяти как корова языком слижет)
13 Garykom
 
03.06.24
14:12
(12) ну дык чтобы модели подгружались при первом использовании
14 lEvGl
 
03.06.24
14:31
(13) при каждом запуске такая ерунда, память подолгу не отпускает, проц почти сразу
15 АгентБезопасной Нацио
 
03.06.24
15:10
Это под мобильное, или под настольный?
16 lEvGl
 
03.06.24
15:12
(15) настольный
мобильный в локальном варианте наверно не вариант будет
17 Волшебник
 
03.06.24
15:13
(11) Ещё бы сделали распознавание истинных потребностей пользователей по радужной оболочке глаза...

18 АгентБезопасной Нацио
 
03.06.24
15:15
(17) если оболочка радужная....
19 lEvGl
 
03.06.24
16:09
по речи все, как и всегда, в ЖКК написано, сразу не увидел

(15)
Распознавание речи не поддерживается:
● В том случае, если информационная база создана в режиме совместимости Версия 8.1.
● В веб-клиенте, который доступен только по протоколу HTTP и не является locahost.
● В веб-клиенте, который работает под управлением:
● веб-браузера Google Chrome версии 65 и предшествующих.
● веб-браузера Microsoft Internet Explorer любых версий.
● веб-браузера Mozilla Firefox любых версий.
● веб-браузера Safari любых версий.
● веб-браузеров на основе Chromium версии 65 и предшествующих.
● В автономном сервере.
● Распознавание речи может работать некорректно в 32-разрядных системах. Модели распознавания речи и дополнительные грамматики загружаются в оперативную память и имеют существенный размер. Поэтому ограниченного объема оперативной памяти 32-разрядных систем может не хватить для загрузки.

В следующих случаях поддерживается только распознавание с помощью сервиса (не поддерживается локальное распознавание):

● На компьютерах фирмы Apple (в файловом варианте информационной базы).
● В учебной версии системы «1С:Предприятие».

В следующих случаях поддерживается только отложенное распознавание речи и распознавание с помощью сервиса (не поддерживается потоковое распознавание):

● При работе под управлением ОС Windows XP или Windows Server 2003.
20 lEvGl
 
03.06.24
16:04
в общем работает, не идеально, но возможно обучение этой сети, наполнение словаря. Подъемно в общем.

Описание нормальное
https://its.1c.ru/db/v8323doc#bookmark:dev:TI000002692



что он делает с памятью так и не понял, снала +2гБ, потом отпускает до 0 или до +1гБ, начинаешь диктовать конечно разрастается, потом освобождает. Но в любом случае при запуске базы пара гигов допом под это уходит
21 mmg
 
03.06.24
23:27
(2) С чего вы взяли, что в онлайн варианте время будет больше? Напротив, оно будет меньше, а качество лучше. Зависит, конечно, от провайдера, но у них сейчас +/- одинаково, потому как конкуренция. К тому же провайдера всегда можно поменять на более шустрого, более качественного. У Сбера, кстати, казахский заявлен, как один из возможных. Yandex поддерживает казахский и узбекский
22 mmg
 
03.06.24
23:30
(2) Насколько сильные дефекты прощает обработчик? Это смотря как вы этот обработчик сделаете. Если после транскрибации, вы примените к тексту GPT, то GPT простит вам практически все (сейчас это верно для русского языка, но не для азиатских)
23 lEvGl
 
04.06.24
09:00
(21) ну да, встал работник такой "запусти.. запусти.. запускай .ля" и стоит ждет, когда нэт появится или когда сервис разгребет всю очередь обращений. "Одинаково" не значит быстро и стабильно, +- одинаково у провайдеров и есть, это да. А сменить провайдера.. что то я устал писать про глупоси
24 mmg
 
04.06.24
09:11
(23) Вы пробовали? Сбер и Yandex работают быстро и стабильно.
25 lEvGl
 
04.06.24
09:15
(24) с коммуникациями как у них?
добавьте сюда же коммуникации потребителя
26 mmg
 
04.06.24
09:17
(25) Просто попробуйте и сравните скорость и качество с вашим локальным вариантом. Что впустую говорить
27 lEvGl
 
04.06.24
09:19
(26) я пробую каждый день, не первый год, когда открываю гугл, и что то меня останавливает юзать на провайдере завязанный функционал. Мне не для надиктовки писем, оперативная работа