|
Разобрать строку по набору свойств | ☑ | ||
---|---|---|---|---|
0
Базис
naïve
15.10.18
✎
18:39
|
Добрый вечер.
Кто делал такое - из строк <Конденсатор UVK105CH1R5BW (0402-C0H-50В-1,5 пФ±0,1пФ) Taiyo Yuden> <Резистор ERJ-14YJ100 (1210-10 Ом±5%) Panasonic> Получить свойства: Тип детали, производитель, размер, номинал, допуск. Задача со звёздочкой: у конденсаторов параметры - ёмкость, напряжение; у резисторов этих параметров нет, есть другие. |
|||
1
Fragster
гуру
15.10.18
✎
18:42
|
в общем случае нерешаемо, но с известными ограничениями (например набор свойств для одного типа одинаковый и идет в одном порядке) сделать можно. а сколько платите?
|
|||
2
Asmody
15.10.18
✎
18:49
|
Задача на парсеры. Задаешь грамматику и прогоняешь по правилам свои строки. Собственно, проблема в грамотном написании правил.
|
|||
3
quest
15.10.18
✎
18:54
|
Не заморачивайся на грамматику. тупо лексер пишешь. Что бы написать - необходим достаточно большой объем изначальных данных (что бы выявиьт закономерности) плюс удобный инструмент что бы править получившийся автомат.
|
|||
4
Garykom
гуру
15.10.18
✎
20:33
|
(0) Решал подобную задачу только осложненную тем что нет строгих правил нахождения свойств в строках наименований
Алгоритм нахождения подстрок в строке Самое наилучшее (если форматы жестко заданы а не меняются постоянно) то действительно написать парсер. С кучей условий и совершенно тупой но зато надежный и простой:
|
|||
5
Garykom
гуру
15.10.18
✎
20:35
|
(4)+ Для облегчения написания условий (выборки свойств из строки каждого вида номенклатуры) можно заюзать RegExp на каждое свойство.
|
|||
6
d4rkmesa
15.10.18
✎
20:55
|
(0) Regexp тут скорее всего на 100% рабочий достаточно сложно будет собрать, хотя при желании можно сделать. Экспериментировал как то, все равно 5-10% остается, из которых трудно извлечь все поля, и это достаточно много(если только наименования не сгенерированы автоматически). Проще действительно обычную процедуру написать, обрабатывая строки посимвольно, распределить по разным блокам.
|
|||
7
Базис
naïve
15.10.18
✎
21:39
|
(1) За идею (зачёркнуто) булочки в столовой работаю. Видать, скоро похудею.
(2) Парсер, лексер... Спасибо, что не Шекельгрубер. Приличные же люди вроде, а так ругаются. (3) Юзвери колотят по тыще новых данных в месяц. (4) Понял. Причём надо подставлять словари - типов, размеров, номиналов E24, единиц измерения. И знать, что мкФ - это только про кондёры, а 0Ом - не из буддизма, а резистор-перемычка. (5) Каждое слово понятно, но чувствую истинный путь в твооей уверенности. (6) Очевидно, что Эти всегда сделают набор данных, превращающих сервер в кирпич, как сегодняшний эксплойт на PSP. Но 80% распознавание было бы очень полезным. |
|||
8
Кирпич
15.10.18
✎
22:49
|
(0) Выложи базу. Побаловаться.
|
|||
9
Базис
naïve
15.10.18
✎
22:50
|
(8) Мыло открой, в паблик не смогу.
|
|||
10
Кирпич
15.10.18
✎
22:56
|
(9) открыл
|
|||
11
Злопчинский
15.10.18
✎
23:09
|
(2) как определить какая строка должна какой грамматикой обслуживаться?
|
|||
12
Базис
naïve
15.10.18
✎
23:29
|
(10) Не открылось. Но у меня с собой данных не оказалось, а удалёнку туда даже не буду согласовывать. Утром справочник покажу.
|
|||
13
vJet
16.10.18
✎
05:03
|
(6) Плюсую за регулярные выражения. Регулярками можно разобрать значителную часть такого набора если не весь. Тут уж как раскуриш регулярные выражения.
|
|||
14
quest
16.10.18
✎
08:57
|
(7) если юзвери вводят это сами то тебе нужно сделать точно наооброт - не разбирать строку, а сделать им форму ввода названия - тогда и название соберешь по нужной маске и составлящие наименования можно обрабатывать без предварительного анализа.
|
|||
15
quest
16.10.18
✎
08:58
|
(11) если извратиться - то можно. Но, проще заюзать состояния в лексиеском анализатрое (что-то типа yybegin(KONDENSATOR_REST))
|
|||
16
quest
16.10.18
✎
08:59
|
(13) не помогут тут регулярки. Точнее могут помочь - но код будет неотлаживаемый и не поддерживаемый.
|
|||
17
quest
16.10.18
✎
08:59
|
(0) Кстати, глянь еще в сторону PEG - будет медленно и тормознуто, но просто описывать.
|
|||
18
Кирпич
16.10.18
✎
09:09
|
(16) да помогут и регулярки и не регулярки. главное знать масштаб трагедии (насколько серьёзно извращались юзеры над списком). тут нужно только понимать в резисторах и конденсаторах немножко.
|
|||
19
Кирпич
16.10.18
✎
09:10
|
вот такой регуляркой для начала можно разделить на части запись "(.+) +(.+) +\(.+\) +(.+)"
потом колдовать с хреновинами типа "0402-C0H-50В-1,5 пФ±0,1пФ" |
|||
20
Кирпич
16.10.18
✎
09:12
|
данных нет. говорить не о чем. может это вообще плёвое дело.
|
|||
21
АгентБезопасной Нацио
16.10.18
✎
09:36
|
может, тупо идти "по шагам"? типа поискали единицу измерения, если омы-фарады-генри , то разбираем по правилам пассивных, иначе - по правилам активных
если пассивные - ищем типоразмер по стандарту. ищем номинал из рядов перед обозначением единицы измерения. от номинала ищем допуск. если конденсатор и пикофарады - проверяем допуск нк абсолютное значение (у резисторов, насколько помню, допуск только процентный). для конденсаторов - из оставшейся части строки ищем рабочее напряжение. а вообще, лучше сделай "мастер" для ввода - там же сможешь и ошибки фильтровать сразу. |
|||
22
Базис
naïve
16.10.18
✎
09:57
|
Пример данных:
1 Резистор RK73H1ETTP1500F KOA (0402 150 Ом ±1%) Каталог "Платан" 2 Конденсатор C0402C221K5RACTU KEMET (0402 X7R-50В-220пФ ±10%) Каталог "Платан" 3 Катушка индуктивности 0603CS-82NXGLW CoilCraft (0603 82нГн ±2%) Каталог "Платан" 4 13.0 MHZ CFPX-180 20/20/-40 TO 85C/18 кварцевый резонатор 5 FYLS-0603UBC Светодиод 6 GRM1885C1H472JA01D Конденсатор 7 Электронный компонент:C0402C105K9PACTU конденсатор керамический (KEMET ELECTRONICS) Словари (номиналы, допуски, производители, ) расширяются. Сложно ли работают регэкспы при этом? (14), (21) - тут многая тыщи этого добра. При вводе нового нужно заводить параметры, убедить будет сложно. Но старое надо упорядочить процентов на 80 автоматом. |
|||
23
palsergeich
16.10.18
✎
09:58
|
(22) Сложно долго и нудно, но реализуемо
|
|||
24
arsik
гуру
16.10.18
✎
10:02
|
мне кажется нужно привязаться к какому ни будь глобальному каталогу электронных компонентов.
|
|||
25
quest
16.10.18
✎
10:07
|
(22) как вариант ragel и свой генератор к нему. Лексеры там пишутся просто. Второй вариант - PEG - быстрое прототипирование, потом уже преобразуешь на автомат (а если использовать waxeye - то автомат получишь сразу)
(24) думаю если бы автор мог - он так бы и сделал. |
|||
26
Кирпич
16.10.18
✎
10:09
|
(24) совершенно верно. самый правильный путь
|
|||
27
Кирпич
16.10.18
✎
10:12
|
(22) мдя... тут уже чуть ли не искусственный интеллект нужен
|
|||
28
Кирпич
16.10.18
✎
10:14
|
выдирать из записи названия по признаку "написано русскими буквами". потом тупить со всякими C0402C221K5RACTU
|
|||
29
quest
16.10.18
✎
10:14
|
+(25) еше вариант томита-парсер от яндекс.
В общем инструментов - немеряно. Остается только сесть и сделать :) |
|||
30
Кирпич
16.10.18
✎
10:15
|
составить список всех названий. причесать его.
(29) да не надо тут никаких парсеров. |
|||
31
ADirks
16.10.18
✎
10:15
|
(0) нынче нейронные сети в моде. как раз для них задачка
|
|||
32
quest
16.10.18
✎
10:20
|
(30) регулярками - не разберешь такое. поэтому парсер нужен в итоге. в (3) я был не прав.
|
|||
33
Базис
naïve
16.10.18
✎
10:22
|
(24) Вроде бы нет такого. А закрытость ещё и онлайны не позволит, только скачать и внутри периметра разбирать.
(28) Для разделения новых и существующих позиций использую это. Причём последние символы часто несущественны. (30) Да, словари упорядочиваю. (31) Да? Вечером буду учить это дело. Есть видео для одинэсников? |
|||
34
ADirks
16.10.18
✎
10:31
|
(33) на ИС проскакивали примеры реализации нейронных сетей на 1С
но боюсь, что одним вечером тут не обойдёшся :) Смысл примерно такой, что н.сеть после соответствующего обучения научается находить закономерности, которые не очень то формализуются. Главное правильно построить процесс обучения. И сеть подобрать. я в этом естественно нифига не понимаю :) |
|||
35
Вафель
16.10.18
✎
10:31
|
(34) для нейронной сети нужна размеченная выборка. где ее взять?
|
|||
36
arsik
гуру
16.10.18
✎
10:32
|
(33) Вы просто плохо ищите. Вот например. Гуглится 5 минут. https://ru.mouser.com/servicesandtools/
|
|||
37
trdm
16.10.18
✎
10:32
|
(7) > Юзвери колотят по тыще новых данных в месяц.
Не позволяй им бардачить. Сделай в номенклатуре шаблон наименования и пусть выбирают из шаблона. Справочников наклепай. Иначе потом не разберешся. У нас задействован такой механизм. Стало быньше геммороя. |
|||
38
Вафель
16.10.18
✎
10:34
|
(37) только сначала нужно будет 100500 шаблонов подготовить. ну или в процессе запуска молниеносно из добавлять
|
|||
39
ADirks
16.10.18
✎
10:34
|
(35) кстати да, это ещё одна суровая трудность
|
|||
40
trdm
16.10.18
✎
10:37
|
+(37) И кстати - заведи в спр. номенклатура "Автор" и раздай потом задание пересобрать наименование товара.
(38) Да нихера. У нас задействован такой механизм (шаблон выбирается в группе): https://image.prntscr.com/image/nZenhtuqRL64fQcQT9LE2A.png |
|||
41
Вафель
16.10.18
✎
10:38
|
(40) Это если номенклатура на группы разбита корректно
|
|||
42
trdm
16.10.18
✎
10:39
|
Само собой Производитель, Модель, Цвет и ДопИнформация - справочники. Дополнительно в шаблон можно подключить штрихкод, артикул и прочее чего душа пожелает.
|
|||
43
Вафель
16.10.18
✎
10:39
|
кстати в ЕРП-УТ11 такое уже есть
|
|||
44
trdm
16.10.18
✎
10:42
|
(43) Ну, у нас это уже лет 12-ть
|
|||
45
Базис
naïve
16.10.18
✎
10:46
|
(40) Вот это реально понравилось, спасибо!
(44) Указанная на форме модель 2003 года. |
|||
46
Кирпич
16.10.18
✎
10:55
|
можно присосаться к какому нибудь серьёзному сайту через яндекс. вводишь UVK105CH1R5BW в яндекс. находишь в результатах нужный сайт и получаешь всё по элементу на странице https://www.terraelectronica.ru/product/2190753
|
|||
47
АгентБезопасной Нацио
16.10.18
✎
10:56
|
(35) из истории справочников, если эти справочники разбирали вручную...
|
|||
48
Кирпич
16.10.18
✎
11:04
|
+(46) для надежности пяток сайтов пригреть и с них грабить
|
|||
49
АгентБезопасной Нацио
16.10.18
✎
11:08
|
(46) такое можно и по даташиту (https://ru.mouser.com/datasheet/2/396/mlcc01_e-1313713.pdf) разобрать.
кстати, можно написать "конструктор парсеров",под каждое новое семейчтво парсер, прогонять через имеющиеся парсеры - скорее всего, сработает полностью только один. |
|||
50
Кирпич
16.10.18
✎
11:22
|
(49) ну как бы всё равно что разбирать. главное принцип, как это можно решить.
|
|||
51
Кирпич
16.10.18
✎
11:26
|
короче:
1. Запрос на яндекс. 2. Парсим страницу яндекса на предмет наличия нужного сайта. 3. Парсим страницу сайта. 4. Результат в базу или сообщение эксперту, что не смогли ничего добыть имхо, самый простой и надежный способ. |
|||
52
Кирпич
16.10.18
✎
11:29
|
(49) даташиты все разные, а краткая информация на сайте более менее структуирована
|
|||
53
АгентБезопасной Нацио
16.10.18
✎
11:36
|
(52) даташитов/производителей не так уж и много.
|
|||
54
Кирпич
16.10.18
✎
11:40
|
(53) ну полтыщи всего
|
|||
55
Кирпич
16.10.18
✎
11:41
|
производителей. и у каждого по полтыщи даташитов
|
|||
56
АгентБезопасной Нацио
16.10.18
✎
12:04
|
(55) не, у производителя даташитов не так много - у них как правило внутренняя классификация отлажена, да и номенклатура не слишком велика (именно номенклатура, без учета разбивки по номиналам-допускам-типоразмерам-напряжениям-ТКЕ/ТКС-исполнению.) . производителей (нормальных) тоже не так уж много
|
|||
57
Кирпич
16.10.18
✎
12:17
|
(56) ну и хорошо, если так
|
|||
58
АгентБезопасной Нацио
16.10.18
✎
12:33
|
(57) бардака, конечно, хватает - интересно, почему какой-нибудь IEEE не введет стандарт....
|
|||
59
Базис
naïve
16.10.18
✎
12:37
|
(58) .. и не исправит всю КД, в которых сыграла серийная и опытная элементная база?
|
|||
60
АгентБезопасной Нацио
16.10.18
✎
12:40
|
зачем? "параллельная нумерация".
|
|||
61
АгентБезопасной Нацио
16.10.18
✎
12:47
|
+(60) Тем же емкостям от Taiyo Yuden можно подобрать вполне добротные аналоги от Cornell серии MCN, и не только их...
|
|||
62
Alres
16.10.18
✎
22:27
|
Я бы сначала создал справочники со значениями параметров - Производители, Значения емкости и пр. и заполнил бы их всеми возможными значениями.
Затем обходом номенклатуры определял бы для нее значения этих параметров Для каждого Номенклатура Из Справочники.Номенклатура Цикл Если Найти(Номенклатура.Наименование, "Конденсатор") > 0 Тогда // Определим ёмкость Для каждого Ёмкость Из Справочники.ЗначенияЕмкости Цикл Если СтрНайти(Номенклатура.Наименование, Ёмкость.Наименование) > 0 Тогда Номенклатура.Емкость = Ёмкость; КонецЕсли и т.д. Понятно что нужно подготовить временные таблицы, и обращаться к ним, а не к базе, а так же вставить сообщения если не смогли определить значение параметра, это просто для примера |
|||
63
Alres
16.10.18
✎
22:29
|
Если какие то значения параметров не нашли - заносим их в справочник и прогоняем парсер по новой, с условием Если Не ЗначениеЗаполнено(%ИскомыйПараметр%) Тогда...
|
|||
64
Злопчинский
16.10.18
✎
22:34
|
Херня это все. напишут грамотеи в прайсе или еще как/где "кандинсатор" - и жпс вашим всем алгоритмам
|
|||
65
Alres
16.10.18
✎
22:36
|
(64) Обязательно напишут. Поэтому заносим в справочник все возможные варианты написания, и после заполнения всех свойств обработкой по замене дублей проходим по справочникам значений свойств, приводя все к единому формату
|
|||
66
АгентБезопасной Нацио
17.10.18
✎
10:05
|
(62) навскидку, некоторые номиналы емкости из ряда могут совпадать с рабочим напряжением. допуски могут быть и процентными, и абсолютными. ну и т.д.
(64) поэтому и надо делать заполнение через мастер. любо высосать даташиты основных поставщиков, и всандалить их классификаторы. |
|||
67
Базис
naïve
17.10.18
✎
15:44
|
Частный вопрос - как убирать все символы кириллицы, КРОМЕ идентификаторов отечественных ИМС вида "1879ВЯ1Я"?
|
|||
68
АгентБезопасной Нацио
17.10.18
✎
16:02
|
(67) регуляркой?
|
|||
69
Сияющий в темноте
17.10.18
✎
16:34
|
Написать пользователям конструктор шаблонов,чтобы сами себе шаблоны готовили,и их же заполняли.
Если оставлять так как есть,то никакой современный парсер не поймет правильно человеческую дурость. |
|||
70
Базис
naïve
17.10.18
✎
18:16
|
(68) А вот и да!
Составьте, пожалуйста, RegExp для отечественных микросхем. Формат: 1. "К" ЕМНИП, признак ИМС общего применения (необязательный символ) 2. "155" Серия. 3 или 4 цифры. 3. "ЛА" Назначение, ограниченный список вариантов, всегда 2 русские буквы. 4. "3" Модификация, кажется. 5. Иногда ещё русская буква, щас буду ГОСТ курить. |
|||
71
Кирпич
17.10.18
✎
18:24
|
(70) выложи ты уже файлик с мусором, который нужно разгребать.
а гост курить не надо наверное |
|||
72
АгентБезопасной Нацио
18.10.18
✎
08:03
|
(70) Ну по моему скудному опыту получается нечто типа
/([К]|[КР]|[КМ])*[0-9]{3,4}[А-Я]{1,2}[0-9]{1,2}[А-Я]?/ Т.е. К или КР или КМ или ничего, потом 3-4 цифры серии, потом две буквы функцонального назначения(группа и подгруппа), затем одна или две цифры порядковый номер в функционале, затем может быть одна буква модификации (по питанию, быстродействию). да, кроме К,КР,КМ еще что-то встречалось, но т.к. отечественными давно не пользуюсь - не помню |
|||
73
АгентБезопасной Нацио
18.10.18
✎
08:05
|
+(72) пардон
/([К]|[КР]|[КМ])*[0-9]{3,4}[А-Я]{2}[0-9]{1,2}[А-Я]?/ |
|||
74
Кирпич
18.10.18
✎
08:38
|
Вы чо на каждую пилюльку собираетесь регулярки писать? Совсем с ума сошли. Их же многия тысячи :)
|
|||
75
АгентБезопасной Нацио
18.10.18
✎
08:39
|
проверил, работает
/([К]|[КР]|[КМ])*\d{3,4}[А-Я]{2}\d{1,2}[А-Я]?/ хотя точнее - надо /([К]|[КР]|[КМ])*[1-9]\d{2,3}[А-Я]{2}\d{1,2}[А-Я]?/ (Номер серии не может начинаться с нуля. ну и по идее, номер разработки тоже не должен начинаться с нуля, но я чот не знаю, как это обойти. |
|||
76
Кирпич
18.10.18
✎
08:44
|
Нужна регулярка на слово на русском. Регулярка на абракадабру букв и цифр, которая обозначает обычно код производителя. Регулярка на параметры типа 100Ом, 100 Пкф и т.п. Список производителей. Список названий компонентов типа Транзистор, Резистор и т.п.
И имея всё это, можно начинать эксперементировать с разбором этого хлама. Шансов мало, но может хоть что то получится. |
|||
77
АгентБезопасной Нацио
18.10.18
✎
08:46
|
(74) не, зачем на каждую? стандарт на классификацию отечественных позволяет по краейней мере определить, что это отечественная микросхема. ну по большому счету и разобрать.
мелкую импортную логику 74 семейства тоже позволяет разобрать - там тоже стандартизировали. семейства микроконтроллеров чуть сложнее - там на производителях завязано. но производителей немного, семейств у каждого тоже - а в семействе уже есть логика. |
|||
78
АгентБезопасной Нацио
18.10.18
✎
08:47
|
(76) "регулярка на параметры" - это ряды Е6-Е192
|
|||
79
Кирпич
18.10.18
✎
08:50
|
1 Резистор RK73H1ETTP1500F KOA (0402 150 Ом ±1%) Каталог "Платан"
2 Конденсатор C0402C221K5RACTU KEMET (0402 X7R-50В-220пФ ±10%) Каталог "Платан" 3 Катушка индуктивности 0603CS-82NXGLW CoilCraft (0603 82нГн ±2%) Каталог "Платан" 4 13.0 MHZ CFPX-180 20/20/-40 TO 85C/18 кварцевый резонатор 5 FYLS-0603UBC Светодиод 6 GRM1885C1H472JA01D Конденсатор 7 Электронный компонент:C0402C105K9PACTU конденсатор керамический (KEMET ELECTRONICS) (78) Где тут стандартизировано? |
|||
80
АгентБезопасной Нацио
18.10.18
✎
08:51
|
(79) 150,220,82
|
|||
81
Кирпич
18.10.18
✎
08:58
|
(80) 13.0 забыл
|
|||
82
АгентБезопасной Нацио
18.10.18
✎
09:11
|
(81) не уверен, что частоты кварцев подчиняются вышеупомянутым рядам. зато уверен, что слишком много исключений из рядов
|
|||
83
Базис
naïve
18.10.18
✎
09:12
|
(82) Кварцы точно не в рядах, 32768 не даст соврать.
|
|||
84
АгентБезопасной Нацио
18.10.18
✎
09:13
|
(83) часовик - он часовик и есть.
|
|||
85
АгентБезопасной Нацио
18.10.18
✎
09:19
|
+(84) просто кроме часовика есть кварцы на частоты радиосвязи, на несущие-поднесущие телевизионного изображения, на частоты радиоуправления игрушками, на частоты UART и USB (причем под разные их скорости), и т.д.
т.е. "исключений больше, чем правил" |
|||
86
Кирпич
18.10.18
✎
09:28
|
(85) а нам не похер, какие бывают кварцы.
я бы делал (76)+(51), ну и навести порядок с вводом новых данных. |
|||
87
АгентБезопасной Нацио
18.10.18
✎
09:41
|
(86) а я б при наличии времени - поизвращался бы с нейронкой. хочу научиться, а это реальная интересная задача.
если топикстартер выложит данные - можно будет заняться... |
|||
88
quest
18.10.18
✎
09:48
|
(87)а как сюда прикрутить нейросети? можешь объяснить?
|
|||
89
Кирпич
18.10.18
✎
09:52
|
(88) Да просто кабелем свой мозг к компу подключит. Он же вроде как шарит в радиодеталях.
|
|||
90
АгентБезопасной Нацио
18.10.18
✎
10:11
|
(88) задача классификации или кластеризации. достаточно типовые для нейросетей
|
|||
91
quest
18.10.18
✎
10:26
|
(90) но на выходе ты получаешь что с вероятностью 60% строка
" RK73H1ETTP1500F KOA (0402 150 " описывает резистор. 20 % конденсатор , 10% диод и 10 % транзистор. смысл в такой кластеризации для решения задачи? |
|||
92
АгентБезопасной Нацио
18.10.18
✎
10:55
|
(91) если я буду знать, что "с вероятностью 60% это описывает резистор", и "с вероятностью 85% это деталь производителя KOA Speer", то мне надо будет обработать всего один даташит.
|
|||
93
quest
18.10.18
✎
11:16
|
с моей точки зрения - это не тот инструмент ля решения задачи ТС. обучающей выборки нет, правила анализа - нет. на выходе только вероятность что угадали ответ.
|
|||
94
АгентБезопасной Нацио
18.10.18
✎
11:20
|
(93) обучающую выборку можно вытащить из исправлений его собственной базы...
не, я не говорю, что нейронки - лучший (или даже просто хороший) вариант - мне просто интересно было бы его попробовать. а вообще - я "втупую" действовал бы через даташиты производителей. |
|||
95
Кирпич
18.10.18
✎
11:59
|
(94) "действовал бы через даташиты производителей"
лучше уж действуй через нейронные сети :) Написать 1000 парсеров для даташитов это очень сурьёзная и очень бесполезная работа :) распарси хотя бы один https://www.ckswitches.com/media/1402/fpush.pdf |
|||
96
Garykom
гуру
18.10.18
✎
12:00
|
(90) Да это задача классификации но не все так просто.
Я этим занимался и добился вполне неплохих результатов, но это пипец как медленно и печально по скорости на проце. Как туда прикрутить GPU ускорение пока не придумал, там очень специфическое программирование дикими ограничениями на память и код. |
|||
97
Garykom
гуру
18.10.18
✎
12:03
|
(96)+ И да ИНС нафик тут не нужны, тут банальное выделение признаков и далее используя вектора признаков юзаем метод k средних.
Т.е. для одной-нескольких строчек выделили например артикул и оно само находит и выделяет артикул в других строках, аналогично с емкостью и прочими параметрами. Но работает очень медленно и чем больше всего строчек тем больший пипец наступает при сравнении векторов. |
|||
98
Garykom
гуру
18.10.18
✎
12:04
|
||||
99
АгентБезопасной Нацио
18.10.18
✎
12:09
|
(97) спасибо, учту. хотя тут артикул и есть "емкость и прочие параметры"
|
|||
100
АгентБезопасной Нацио
18.10.18
✎
12:09
|
(95) не такая уж и страшная. не вижу никаких сложностей
|
|||
101
Кирпич
18.10.18
✎
12:11
|
(100) да ваще молодец
|
|||
102
Кирпич
18.10.18
✎
12:13
|
(98) высокое программирование...
|
|||
103
Кирпич
18.10.18
✎
12:14
|
за время писания этой ветки, четыре бабы уже бы полбазы руками перебили :)
|
|||
104
Garykom
гуру
18.10.18
✎
12:16
|
(102) Обычное программирование но когда у меня при реализации на C# на табличках в 100 строк наступали дичайшие тормоза при выделении одного артикула - задумалось на пару секунд, выделил еще один - уже 10 секунд, еще один и приехали ждем минуты.
Понял что это что то не то или нужна дичайшая оптимизация. Можно конечно навыделять правильно сначала (подготовить обучающую выборку) а затем натравить и ждать пока оно там отработает, но мне то надо было в онлайне чтобы с разными форматами работать. |
|||
105
АгентБезопасной Нацио
18.10.18
✎
12:22
|
(103) "лучше день потерять, а потом за пять минут долететь"©КНХ
|
|||
106
Garykom
гуру
18.10.18
✎
12:33
|
(105) В данном случае это не прокатывает потому что оператор должен видеть что там ai наклассифицировал и поправлять его на лету.
Фишка алгоритма что все взаимосвязано и выделив какое то свойство в новой строке можно испоганить автовыделение в правильных уже строках. |
|||
107
Garykom
гуру
18.10.18
✎
12:41
|
(103) Если бабы умеют формулы в эксель то двух хватит и вся база уже была бы готова
|
Форум | Правила | Описание | Объявления | Секции | Поиск | Книга знаний | Вики-миста |