CRM-система для УК и ТСЖ

pdf/a формат

Будете спамить рекламой - будем нещадно банить)))
Сообщение
Автор
two_oceans
Ветеран
Сообщений: 546
Зарегистрирован: 30 сен 2016, 17:17
Благодарил (а): 439 раза
Поблагодарили: 415 раза

pdf/a формат

#41 Сообщение two_oceans » 20 апр 2017, 07:33

virus_mvs писал(а):Источник цитаты сканировал текстовый документ изначально с такими параметрами.
Тут понятно, а при соединении jpg в pdf какие параметры были? Дело в том, что в некоторых картинках по умолчанию ставится 96 dpi, даже если они по факту отсканированы на 300 dpi. Это связано с тем, что на старых мониторах если "родное" разрешение (типа 1024 на 768) поделить на соответствующий линейный размер монитора по ширине и высоте получалось 96 dpi. Несоответствие указанного разрешения и реального разрешения обычно приводит к тому что файл на экране много больше бумажного аналога. Если изменить поле разрешение в файлах на реальное (150 или 300), визуально на экране они уменьшатся.
Не так давно я мучался с электронными заявлениями на изменение в ЕГРЮЛ - внезапно ввели что разрешение в файле TIF должно быть 300 dpi. Ну, раз хотят, исправил поле разрешения на 300, страница a4 стала как 7 на 10 на экране.
Последний раз редактировалось two_oceans 20 апр 2017, 07:39, всего редактировалось 1 раз.

virus_mvs
Бывалый
Сообщений: 375
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 136 раза
Поблагодарили: 141 раза

pdf/a формат

#42 Сообщение virus_mvs » 20 апр 2017, 07:37

программа использовалась: FastStone Image Viewer
параметры такие:


И еще вопрос такой: У меня много протоколов на 1 страницу хранящихся в Jpeg-формате. По ним тоже необходимо делать возможность поиска. Получается и их нужно переводить в формат pdf/a ?
Вложения
фот3.jpg

Sergey_P
Ветеран
Сообщений: 6947
Возраст: 36
Зарегистрирован: 11 ноя 2015, 16:53
Откуда: Костромская губерния
Благодарил (а): 604 раза
Поблагодарили: 3680 раза

pdf/a формат

#43 Сообщение Sergey_P » 20 апр 2017, 07:56

пдф/а формат это форрмат для нормативных документов. я выставляю распознанный пдф с графикой типа печатей и подписей ... правда сканирую я сразу ридером, размер файлов не более мегабайта.
Если же вы делаете пдф/а, то это распознанный текст поверх существующего джипега и ессно он будет больше чем изначальный размер.
У вас выходов несколько
а) перестать использовать пдфа
б) сжимать пдф понижая его качество уже после создания (например тут попробуйте http://pdf-docs.ru/)

two_oceans
Ветеран
Сообщений: 546
Зарегистрирован: 30 сен 2016, 17:17
Благодарил (а): 439 раза
Поблагодарили: 415 раза

pdf/a формат

#44 Сообщение two_oceans » 20 апр 2017, 08:00

Нашел статью по FastStone, DPI: Screen пишут означает 72 dpi, а Original file должно подставить правильное разрешение с которым файл сканировался. То есть в исходном было даже не 96, а 72!
virus_mvs писал(а):Источник цитаты По ним тоже необходимо делать возможность поиска. Получается и их нужно переводить в формат pdf/a ?
Получается так, чтобы был единый стандарт. Но на этот раз можно обойтись без FastStone Image Viewer и промежуточного pdf - FineReader и JPEG прекрасно открывает, в том числе можно открыть кучу файлов и получить многостраничный.

Отправлено спустя 4 минуты 43 секунды:
Sergey_P писал(а):Источник цитаты правда сканирую я сразу ридером, размер файлов не более мегабайта
Вот вот, а если несколько промежуточных операций, то там дело не в pdf/a. В данном случае похоже дело в разрешении, а не в шрифтах и текстовом слое под картинкой.

virus_mvs
Бывалый
Сообщений: 375
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 136 раза
Поблагодарили: 141 раза

pdf/a формат

#45 Сообщение virus_mvs » 20 апр 2017, 08:42

Провёл тесты.
исходник: квитанция на оплату стационарного телефона + несколько рукописных слов. (нет протоколов под рукой)) )
1) бумажный документ отсканировал через средства виндовс. размер файла получился 220Кб
2) Перевёл jpeg из п.1 в pdf через FastStone. размер стал 148 Кб
3) Перевёл pdf и п.2 в pdf/A через FineReader12. Размер стал 180 Кб.

4) Отсканированный jpeg из п.1 скормил сразу в FineReader12 и сделал из него pdf/A. Размер - 186 Кб.

5) отсканировал и распознал сразу через FineReader12 и сделал из него pdf/A. Размер - 170 Кб. Тут стоит сказать что минимальный dpi был 200. Мелкий шрифт находится лучше всего. Из присутствующих 4 слов - нашлось все 4. В предыдущих вариантах - из 4 одинаковых слов находилось 3 появления, а в одном случае вообще 2.

Выходит что вариант №5 самый оптимальный, а также сокращающий время на сохранение промежуточных документов.

Спасибо большое за помощь откликнувшимся!!!

Sergey_P
Ветеран
Сообщений: 6947
Возраст: 36
Зарегистрирован: 11 ноя 2015, 16:53
Откуда: Костромская губерния
Благодарил (а): 604 раза
Поблагодарили: 3680 раза

pdf/a формат

#46 Сообщение Sergey_P » 20 апр 2017, 08:47

virus_mvs писал(а):Источник цитаты 5) отсканировал и распознал сразу через FineReader12 и сделал из него pdf/A. Размер - 170 Кб. Тут стоит сказать что минимальный dpi был 200. Мелкий шрифт находится лучше всего. Из присутствующих 4 слов - нашлось все 4. В предыдущих вариантах - из 4 одинаковых слов находилось 3 появления, а в одном случае вообще 2.

и это ... сохраняйте простой пдф, зачем вам формат, предусмотренный для законотворцев? у нас этого формата нет в перечне разрешенных.
попробуйте 5 вариант, только сохраните в пдф.

virus_mvs
Бывалый
Сообщений: 375
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 136 раза
Поблагодарили: 141 раза

pdf/a формат

#47 Сообщение virus_mvs » 20 апр 2017, 09:02

Sergey_P писал(а):и это ... сохраняйте простой пдф, зачем вам формат, предусмотренный для законотворцев? у нас этого формата нет в перечне разрешенных.
попробуйте 5 вариант, только сохраните в пдф.

Оооо.. оказывается в простом ПДФе тоже можно сохранить с возможностью поиска. Я с этим никогда не сталкивался и думал что только формат ПДФ/А позволяет делать поиск в документе. Кстати размер в обычном pdf стал 107Кб.

Хммм.. Сейчас свои изначальный договор (в ПДФе составленный из jpeg-картинок) на 21 страницу и размером 7,13Мбайт запихал в ФайнРидер. Распознал и сохранил в обычном ПДФе. Размер усох до 5.65 Мбайт .
Затем тот же изначальный файл сохранил в пдф/А с теми же параметрами, получилось разжирел на 140 Кб и стал 7,27Мбайт.

two_oceans
Ветеран
Сообщений: 546
Зарегистрирован: 30 сен 2016, 17:17
Благодарил (а): 439 раза
Поблагодарили: 415 раза

pdf/a формат

#48 Сообщение two_oceans » 20 апр 2017, 10:16

virus_mvs писал(а):Источник цитаты Оооо.. оказывается в простом ПДФе тоже можно сохранить с возможностью поиска. Я с этим никогда не сталкивался и думал что только формат ПДФ/А позволяет делать поиск в документе. Кстати размер в обычном pdf стал 107Кб.
Подозреваю, что (5.65) это основной вариант pdf без целой сканированной картинки всей страницы - как если бы в ворде вставили факсимиле, картинки и сохранили в pdf. Если хорошенько почистить, уменьшить картинки и разрешение уменьшить наверно еще меньше будет - не 5 Мб текста же там. Для поиска он подойдет, но подлинность документа не докажет. В новых версиях формата pdf можно не только картинки, даже видеоролики вставлять, но это не к FineReader у однозначно, он поддерживает довольно старую версию (у меня на выходе pdf 1.4), которой достаточно для текста и картинок.

Второй вариант - с сохраненной полной картинкой страницы и тестовым слоем, он конечно больше (7.27). Спасибо за интересные опыты.

virus_mvs
Бывалый
Сообщений: 375
Зарегистрирован: 21 май 2015, 12:42
Откуда: Пермский край
Благодарил (а): 136 раза
Поблагодарили: 141 раза

pdf/a формат

#49 Сообщение virus_mvs » 20 апр 2017, 11:32

two_oceans писал(а):Подозреваю, что (5.65) это основной вариант pdf без целой сканированной картинки всей страницы - как если бы в ворде вставили факсимиле, картинки и сохранили в pdf. Если хорошенько почистить, уменьшить картинки и разрешение уменьшить наверно еще меньше будет - не 5 Мб текста же там. Для поиска он подойдет, но подлинность документа не докажет.

При сохранении в формате pdf настройки сохранения такие же. Я так же (как и в случае с pdf/A) выбирал "текст под изображением", таким образом картинка, на которой находятся распознанные буквы, всё равно должна (теоретически) остаться. Не понятно что-то мне вобщем куда делись 2 Мб эти. И в каком всё таки формате правильно сохранять: pdf или pdf/A. Точнее даже так: можно ли сохранять в обычном pdf?
Последний раз редактировалось virus_mvs 20 апр 2017, 11:35, всего редактировалось 1 раз.

Sergey_P
Ветеран
Сообщений: 6947
Возраст: 36
Зарегистрирован: 11 ноя 2015, 16:53
Откуда: Костромская губерния
Благодарил (а): 604 раза
Поблагодарили: 3680 раза

pdf/a формат

#50 Сообщение Sergey_P » 20 апр 2017, 11:35

в пдф правильно, в нормативке у нас нет в перечне пдфа формата.


Вернуться в «ГИС ЖКХ. Форум разработчиков программного обеспечения и всего, что с ним связано»

Кто сейчас на форуме

Количество пользователей, которые сейчас просматривают этот форум: нет зарегистрированных пользователей и 1 гость