Имя: Пароль:
IT
 
Есть приложение-диктофон на смартфоне и ПК, который делает расшифровку записей?
0 Гений 1С
 
гуру
14.03.21
15:18
Собственно?
1 Aleksey
 
14.03.21
15:27
Таким приложениям лет20 даже скайп так может
2 Aleksey
 
14.03.21
15:28
дрое дело что качество - ну так чисто поржать
3 acanta
 
14.03.21
15:38
Сколько времени ии требуется чтобы качественно преобразовать в текст речь одного конкретного человека (предположим, с особенностями, как Стивен Хокинг) и как именно этот процесс будет происходить?
4 Aleksey
 
14.03.21
15:43
(3) В том то и дело что бесплатно это никто делать не будет. А платно это стоит дорого, гений повеситься платить за программу такие деньги
5 Cyberhawk
 
14.03.21
15:45
В Телеграме есть бот Voicy, который голосовые сообщения конвертирует в текст. Более-менее вменяемо.
6 Волшебник
 
14.03.21
16:29
7 NorthWind
 
14.03.21
16:41
(0) да много кто умеет. Evernote умеет вроде как заметку в текст с голоса писать...
8 NorthWind
 
14.03.21
16:42
другой вопрос, что надо понимать а) ваши записи уходят с устройства в облако, потому что никакой смартфон не сделает это своими вычислительными мощностями; б) качество полученного текста может быть так себе.
9 Cyberhawk
 
14.03.21
17:09
(8) "никакой смартфон не сделает это своими вычислительными мощностями" // А как же локально работающие колонки от Амазона или Гугла?
10 Ненавижу 1С
 
гуру
14.03.21
18:25
Теперь ты будешь свои гениальные сабжи надиктовывать?
Можно оставлять оригинал получающегося текста, смысл будет примерно соответствовать оригинальному.
11 BeerHelpsMeWin
 
14.03.21
19:08
Найми студента за тарелку супа.
12 piter3
 
14.03.21
19:42
(11) ну да,еще 10 тем новых на мисте)
13 ДедМорроз
 
14.03.21
19:46
(9) колонка,как раз,без облака ничего не может,т.к.вся обработка идёт в облаке,что позволяет в саму колонку ставить процессор,который только и может,что передать запись на обработку и озвучить переданный назад ответ.
14 Гений 1С
 
гуру
14.03.21
21:13
(4) я готов платить. Раз гугл умеет распознавать сносно (голосовой ввод вместо клавиатуры), думаю вопрос решенный
15 Гений 1С
 
гуру
14.03.21
21:14
(7) писать умеет, распознавать не умеет. Ну и эвернот стартует долго, кроме того, у него сложный API, я так и не понял, как подступиться.
16 vovastar
 
14.03.21
21:15
(14) ух ты блин, растешь на глазах!!!
Когда начнешь задумываться о покупке Майбаха?
17 acanta
 
14.03.21
21:16
Посмотрите ролики в ютубе о метро. Там голосовые команды на складе комплектовщики используют.
18 vovastar
 
14.03.21
21:19
(14) прострелянное трико заменил?
19 NorthWind
 
14.03.21
21:27
(9) чет я ну просто адски сомневаюсь, что там вообще есть оффлайн для подобных вещей. Либо есть, но с сильно ограниченным набором команд, буквально десяток-другой слов на одном языке. Ни о каком полноценном распознавании речи оффлайн не может быть и разговора имхо, ну или к колонке надо серверок приложить с хорошей дисковой подсистемой под речевую библиотеку.
20 NorthWind
 
14.03.21
21:30
(17) на ограниченном наборе слов можно сделать оффлайн. Распознавание фамилий из записной было даже на телефонах 20-летней давности, правда работало так, что можно считать, не работало.
21 RomanYS
 
14.03.21
21:33
(20) выключил интернет на смарте, зашел в стандартные (гугловые) заметки, надиктовал - всё распозналось.
22 Гений 1С
 
гуру
14.03.21
21:39
(21) это не удобно. нужно сперва записать, потом распознать
23 Злопчинский
 
14.03.21
21:44
Смотря для чего.
на рынке за вполне вменяемую цену можно скинуть человеку запись голосовую - тебе возвращают текстовку, во вполне вменеямом виде. с разбивкой, выделением разных говоряих и пр.
24 Гений 1С
 
гуру
14.03.21
21:49
(23) я не могу доверять свои личные дневниковые записи секретарю
25 Гений 1С
 
гуру
14.03.21
21:50
(6) ну голосовой ввод есть и у Гугл, вопрос в оперативности, нужна несколько другая схема. Сперва записать, потом распознать.
26 Гений 1С
 
гуру
14.03.21
21:50
(5) ну как вариант, только довольно криво. Сделать приватный чат самому себе, ярлык для добавления в этот чат аудио, гм.
27 Гений 1С
 
гуру
14.03.21
21:51
(21) там база локально подсасывается, не такая уж она и большая
28 Вафель
 
14.03.21
22:48
ок гугл добавь заметку
и далее текст
29 Гений 1С
 
гуру
15.03.21
07:43
(28) текст голосом?
30 NorthWind
 
15.03.21
08:29
я как-то на айпэде пробовал всю эту фигню лет несколько назад... Пока одно предложение произносишь - в принципе, норм. Но стоит надиктовать текст хотя бы на несколько строк, там исправлений уже получается столько, что проще с клавиатуры сразу правильно сделать, чем потом исправлять.
31 Гений 1С
 
гуру
15.03.21
08:42
(30) ну мне не нужна точность, главное не забыть, что записывал, т.е. если вообще не точно, то можно и голос послушать.
32 NorthWind
 
15.03.21
09:09
(31) нет там точности. Он некоторые слова иногда вообще неправильно понимает или понимает одно слово как два. Читать нужно медленно, разборчиво, четко отделяя слова, это довольно много времени занимает.
33 NorthWind
 
15.03.21
09:11
именно поэтому я и пришел к выводу, что если сложить время прочтения со временем корректировки, то проще слепым методом с клавы :)
34 ИС-2
 
naïve
15.03.21
09:41
(0) на смартфоне использую VoiceNot. Качество устраивает. Еще контакт научился речь переводить в текст
35 Cyberhawk
 
15.03.21
14:22
36 Гений 1С
 
гуру
15.03.21
14:56
(34) VoiceNot or VoiceNote? там нет синхронизации с ББ, так?
37 Гений 1С
 
гуру
15.03.21
15:03
Попробовал, через ОК гугл заметки удобно создаются, но как их увидеть на компьютере?
38 программистище
 
15.03.21
15:04
гуглклава разпознает речь давно уже
39 Гений 1С
 
гуру
15.03.21
15:21
https://myactivity.google.com/activitycontrols/webandapp?view=item&product=31 - ну вот тут можно посмотреть все что говорилось, но как отфильтровать только заметки, хз
40 Leonardo1c
 
15.03.21
15:26
41 Гений 1С
 
гуру
15.03.21
15:37
в общем все норм с Гугл-заметками, только не понятно, где их на ББ смотреть.
42 ДедМорроз
 
15.03.21
19:37
Основной момент
Если специально и четко говоришь,делаю паузу между словами и паузу побольше,между предложениями,то вполне нормально распознаётся.
А вот если запись с телефона или просто беседа,то не очень.
43 NorthWind
 
15.03.21
19:49
(42) угу, именно так. Говоришь примерно как человеку с задержкой в развитии, или иностранцу. Делая паузы между словами. Сказать длинный текст так довольно сложно, потому что голова забивается тем "как" сказать, а не "что" сказать.
Закон Брукера: Даже маленькая практика стоит большой теории.