Имя: Пароль:
IT
Админ
Задачка с удаленными и восстановленными doc файлами
,
0 Garykom
 
гуру
14.05.19
16:43
Бух случайно грохнула на сетевой шаре (linux, samba) нужную папку с важными анкетами клиентов (примерно 70 штук) в формате doc (обычный Word 97-2003).
Архивов как обычно нет, ибо оно хранилось вне каталогов настроенных для бэкапов.
Корзины по дефолту не было на sambe.

Через TestDisk требуемый каталог в удаленных обнаружить не вышло, но PhotoRec восстановил ~64000 doc файлов среди которых нашлось ~3600 .doc файлов.
Понятно дело большая часть их не открывается нормально ибо кривые, но совершенно случайно среди них обнаружил часть требуемых (примерно 5 штук) и они нормально открываются.

Все требуемые имеют табличку внутри с шапкой в первой ячейке "Анкета клиента – юридического лица".

Каким образом проще всего обработать все ~3600 файлов.
Т.е. открыть их как документы word (учитывая что они кривые) и выбрать среди них те что нормально откроются и содержат требуемую строку?
1 Garykom
 
гуру
14.05.19
16:44
(0) *восстановил ~64000 всего файлов
2 SeriyP
 
14.05.19
16:59
(0) попробуйте разными программами для восстановления данных погонять, какая-то может и подхватит структуру файловой системы с именами файлов и папок
3 Сияющий в темноте
 
14.05.19
17:21
надо было не восстанавливать а лочить диск с шарой и смотреть сектора,они у файлов могут пересекаться,для таких ищем по дате файла последний,а остальные в топку.
если ворд новый,то там зип архив и можно проверить,что он распаковывается и правильные контрольные суммы.
если ворд старый,то там стандартный компаунд,у которого можно посмотреть структуру на предмет валидности.
4 Garykom
 
гуру
14.05.19
17:30
(3) >ворд старый,то там стандартный компаунд,у которого можно посмотреть структуру на предмет валидности.

И?
5 Garykom
 
гуру
14.05.19
17:30
(4)+ Что есть готовое для проверки валидности компаунда?
6 Garykom
 
гуру
14.05.19
17:31
(2) ext4 на /dev/md0 ? Все что можно уже вытащил, пусть и лишнее
7 Tatitutu
 
14.05.19
18:13
(0) в почте
8 Tatitutu
 
14.05.19
18:33
напиши макрос или обработку

1. перебор всех в папке
2. Открыть - открывается хорошо, сохранить в другую папку
3. По "хорошим" файлам пройтись , открыть, поиск нужной строки , нашли - закрыли сохранили в другой попочке



Public Sub ПереборФайлов()
On Error GoTo bay:
Dim WB As Word.Document
    With Application.FileSearch
        .LookIn = "D:\work\"
        .FileType = msoFileTypeWordDocuments  'тип файлов
        .Execute
        If .Execute() > 0 Then
            For i = 1 To .FoundFiles.Count
                Set WB = Workbooks.Open(.FoundFiles(i), , False)
                '*************
                ' поиск строки нужной
                
                WB.Close True
                
                ' скопировать в нужную папку (этот файл открывается)
            Next i
        End If
    End With
Set WB = Nothing
Exit Sub
bay:
    MsgBox WB & "плохой файл"
End Sub
9 Tatitutu
 
14.05.19
18:36
(8) это для до 2007 офиса
дальше мягкотелые отказались от Application.FileSearch
но ты пишешь файлы, *.doc
Обработает очень быстро
10 Garykom
 
гуру
14.05.19
18:37
(8) Так эта зараза пытается как как текстовый или csv файл открыть, в этом проблема. Так бы иначе легко решил.

Нужна именно некая штука типа проверки целостности компаунда как архива.
11 Garykom
 
гуру
14.05.19
18:57
Гыы все оказалось сильно проще, Windows 7 умеет штатно искать в содержимом.

Банально стандартный виндовый поиск в папке слова "Анкета клиента", затем как не нашло "Содержимое файлов" выдал только целые файлы.

Но их оказалось дохрена и больше, ибо особенность файловой системы что при перезаписи оно походу в новое место копирует, помечая на удаление старую версию.
Огромная куча одинаковых файлов но это уже пусть сама бух разбирается.
12 sdv2000
 
14.05.19
19:44
Глядишь, перестанет "случайно грохать" важную инфу
13 Garykom
 
гуру
14.05.19
19:46
(12) Уже настроил корзину для этой шары в самбе, теперь фиг удалит.
Оно даже в корзине не дает юзерам удалить, но придется периодически чистить старые или скрипт наваять чтобы старые сам того через какой то срок.
14 Garykom
 
гуру
14.05.19
19:47
(12) Специально ей нет смысла (самой бы и пришлось восстанавливать анкеты для ПОД/ФТ), несколько папок удаляла и мышкой зацепила не то что надо
15 sdv2000
 
14.05.19
19:49
зацепила мышкой не то, что надо?
ну это хорошее оправдание
16 sdv2000
 
14.05.19
19:50
по факту ТЫ всё восстанавливаешь
17 Garykom
 
гуру
14.05.19
19:51
(16) За это мне и платят зарплату хотя я нихрена не делаю большую часть времени.
18 Garykom
 
гуру
14.05.19
19:52
Уже и как выбрать одинаковые анкеты придумал для каждого контрагента, но нафуй не буду.
Пусть среди ~800 файлов выбирает нужные ~70 ))
19 sdv2000
 
14.05.19
19:53
я всё понимаю, отчетный период и т.д., но аккуратность в работе надо проявлять
поломай пару-тройку компов, будет работа
20 sdv2000
 
14.05.19
19:55
опять же, телефония стационарная?
если да - внедряй ip
21 Garykom
 
гуру
14.05.19
19:55
(18)+ Хм так прикольно, по сути как теневые копии.
Т.е. видно как постепенно файл-анкету заполняли нажимая сохранить.

Короче храните данные на шаре самбы на ext4 - никакой троян и шифровальщик нифуя не сделает.
22 Garykom
 
гуру
14.05.19
19:57
(20) Телефония практически не используется, телеграм основное средство общения среди своих.
А так у нас сотовые на корпоративном договоре, это удобнее.
23 sdv2000
 
14.05.19
19:57
сотовые - это понятно, у нас корпорация по всей стране, дозвон по 3 цифрам
24 sdv2000
 
14.05.19
19:59
а так то смотрю, сам себя развлекаешь
может, и папки сам удалил? :)
25 Garykom
 
гуру
14.05.19
20:02
(24) Не я уже на ее вопли пришел и сразу попытался восстановить.

Только не понял почему именно этот удаленный каталог не показывался в TestDisk хотя другие удаленные рядом файлы было видно как и другие ранее удаленные каталоги не те что надо восстановить.
26 sdv2000
 
14.05.19
20:28
сколько раз нелогичные вещи в своей практике обнаруживал?
27 Garykom
 
гуру
14.05.19
20:32
(26) Обнаружил что нет нелогичных вещей, просто логика другая совершенно и не понятная.
28 Garykom
 
гуру
14.05.19
20:33
(27)+ И что обычно проще на заморачиваться пониманием непонятной логики если оно редко очень встречается.
29 mistеr
 
14.05.19
21:24
(0) >Через TestDisk требуемый каталог в удаленных обнаружить не вышло, но PhotoRec восстановил ~64000 doc файлов среди которых нашлось ~3600 .doc файлов.

extundelete не пробовал? Мне один раз помогло.
Кaк может человек ожидaть, что его мольбaм о снисхождении ответит тот, кто превыше, когдa сaм он откaзывaет в милосердии тем, кто ниже его? Петр Трубецкой