PostgreSQL, документы с большим количество проводок и ведомость амортизации
0 dimawrx
ешил попробовать Postgre 8.3.8 для типовых Бухгалтерии 1.6 и Зарплаты 2.5, переделанных для учета в сельском хозяйстве, и был удивлен тем что по сравнению с MSSQL 2005 получил уменьшение времени формирования отчетов и проведения документов с небольшим количеством проводок v8: PostgreSQL. Перенос каталога pg_xlog, хотя чаще всего попадалась информация о том, что будет некоторое падение производительности.
И все бы замечательно, но есть два неприятных момента. Первый, стали очень долго проводиться документы с большим количеством проводок, например документ по вводу остатков на 3000 позиций проводится около получаса, хотя в MSSQL не более 2-минут. Причем почти все эти полчаса в "состоянии" PostgreSQL пишет <IDLE>, а процесс rphost показывает 100% загрузки, затем в последние 1-2 минуты загрузка rphost падает и PostgreSQL начинает выполнять запросы. Рост времени проведения растет в геометрической прогрессии от количества проводок в документе.
И второй момент, перестала формироваться "Ведомость амортизации", по крайней мере 5 часов ожидания ни к чему не привели. Процесс rphost не загружен, а вот postgres загружает так, что даже начинают отваливаться клиенты от сервера. В "состоянии" PostgreSQL видно выполнение какого-то одного запроса.
Читая в инете, кто и как бился с этой ведомость, нашел, как при помощи следующих настроек у одного человека ведомость заработала:

max_locks_per_transaction = 250
checkpoint = 12
shared_buffers = 256MB
temp_buffers = 20MB
work_mem = 10MB
maintenance_work_mem = 60MB
max_fsm_pages = 1024000
max_fsm_relations = 5000
checkpoint_timeout = 10 min
checkpoint_warning = 60sec

Но увы, мне это не помогло. Зато, о чудо, документ в 3 тыс. проводок стал проводится всего 10 минут:) Это конечно далеко не так как в MSSQL, но уже стало терпимо.
Потом нашел упоминание о enable_nestloop, поставил в off, ведомость на 950 основных средств сформировалась практически мгновенно, быстрее, чем в MSSQL. Т.е. ведомость амортизации и все вышеперечисленные настройки, кроме enable_nestloop, между собой не связаны.
Решил после этого проверить скорость проведения 100 документов, получилось следующее:
время    shared_buffers    enable_nestloop
5:26        128    off
5:24        64    off
5:13        256    off
1:32        256    on
Т.е. падение производительности более чем в три раза при enable_nestloop=off, что ни в какие ворота не лезет.
Таким образом либо не работает ведомость амортизации и все летает, либо тормозим, но с ведомостью :(
Сейчас я вышел из этого положения так - нашел самого смышленого бухгалтера, написал ей инструкцию как включать и выключать enable_nestloop когда надо формировать ведомость амортизации. Но все это как-то не красиво ...
Интересно, можно ли посылать серверу сигнал о том что для этого соединения и запроса использовать enable_nestloop=off? Можно еще переписать ведомость амортизации. Ну, или дождаться, пока 1С сделает оптимизацию сервера приложений под PostgreSQL:)
Я думаю, многие, кто ставил PostgreSQL, сталкивались с этими проблемами,  получилось ли их решить?
1 valeriy vm
нет с таким не сталкивался, но информация интересная, у меня постгреустановлен 8.3.3 и там shared_buffers = 2048MB у меня
2 valeriy vm
расчет себестоимости к примеру по времени примерно 10-15 минут, документ отражение проводок в регл. учете 2-3 минуты проводок порядка 5000.
3 dimawrx
(1) а ведомость амортизации формируется?
4 valeriy vm
(3)да и причем можно сказать что в течении 1 минуты, бухи формируют не жалуются на время формирования
5 valeriy vm
все отчеты работают)
6 dimawrx
такие "гигантские" значения shared_buffers я не пробовал, сколько оперативки на сервере? enable_nestloop off или on?
7 valeriy vm
enable_nestloop вообще не трогал.
оперативки 8 гб, вин сервер 2003 ср2 64 бит
щас точно не помню может да же shared_buffers = 4096мб т.е. половина оперативки как советует 1С
8 dimawrx
1С советует половину от оперативки для effective_cache_size, у меня на сервере 4Гб, соответственно effective_cache_size 2 Гб. У тебя точно это shared_buffers?
9 valeriy vm
(8))))точно чо та напутал, щас посмотреть не могу на работе все а удаленного доступа щас пока нету
10 dimawrx
(9)ок, я подожду:)
а так, пока я вижу только разницу - 32 и 64 бит операционка. Может в этом причина...
сервер приложений на одном сервере с Постгре?
11 valeriy vm
и вроде 8.3.8 не работает под вин 64бит только линукс, по этому не переходил на 8.3.8
12 valeriy vm
постгре отдельно на машине, сервер 1С + терминал на отдельной машине, т.е. два сервака
13 dimawrx
на сайте 1С сервер приложений 64бит есть только под Линукс, под Windows только 32бита, все версии. Интересно, взаимодействие сервера приложений 1С и PostgreSQL, при нахождении на одном сервере и на разных отличается как-нибудь (протоколы и т.п.)?
14 shuhard
(13)[под Windows только 32бита]
плохо смотрел
15 Nexux
16 dk
"на сайте 1С сервер приложений 64бит есть только под Линукс, под Windows только 32бита, все версии."
17 Chai Nic
Не.. ну всё правильно. nested loop join в лучшем случае быстрее всех остальных методов, но в худшем значительно хуже их. У меня в ЗУПе средние потери производительности при отключении его незначительны, однако расчет зарплаты производится очень быстро, практически не нагружая sql-сервер. В общем, каждый пусть сам решает.
18 Chai Nic
Кстати, при использовании более сложных чем nested_loop методов сервер интенсивно использует оперативную память.. и если он думает что её мало (на основании значения effective_cache_size) - то начинает работать неоптимально, с использованием временных таблиц на диске. Этот параметр в первую очередь надо проверить, он должен быть примерно половина физической памяти сервера. А вот shared_buffers - это уже тонкая настройка, и большого эффекта не дает.
19 valeriy vm
в понедельник попробую enable_nestloop=on, еслит зарплата будет действительно быстро считаться то гуд! Потому как именно расчет зарплаты самый долгий.
20 Chai Nic
(19) Только наоборот, off.. По умолчанию включены все методы.
Кстати. Если ты отключишь какой-то метод, но сервер сможет выполнить запрос только с помощью него - всё равно он будет задействован. По сути, отключение метода - это рекомендация ("если есть выбор - не используй"), а не жесткая директива.
21 dimawrx
(14)(15)(16) действительно, не туда смотрел.
(20) можно ли при выполнении запроса из 1С указывать для PostgreSQL необходимое значение enable_nestloop?
22 Chai Nic
(21) Если только через что-то типа 1с++, с прямым доступом к серверу. А на языке запросов 1с таких директив нет. Вообще, ведь наверняка есть некие критерии для запросов 1с, которые определяют какой метод лучше использовать для джойна - и логично чтобы сервер приложений анализировал это и давал соответствующую подсказку sql-серверу. Но похоже этого пока нет, всё делается в расчете на "интуицию" sql-сервера, который на характерных для 1с многоэтажных джойнах часто ошибается.
23 dimawrx
Если у кого в типовой бух. 1.6 на PostgreSQL ведомость амортизации работает, скиньте пожалуйста ваши настройки.
24 valeriy vm
# -----------------------------
# PostgreSQL configuration file
# -----------------------------
# This file consists of lines of the form:
#   name = value
# (The "=" is optional.)  Whitespace may be used.  Comments are introduced with
# "#" anywhere on a line.  The complete list of parameter names and allowed
# values can be found in the PostgreSQL documentation.
# The commented-out settings shown in this file represent the default values.
# Re-commenting a setting is NOT sufficient to revert it to the default value;
# you need to reload the server.
# This file is read on server startup and when the server receives a SIGHUP
# signal.  If you edit the file on a running system, you have to SIGHUP the
# server for the changes to take effect, or use "pg_ctl reload".  Some
# parameters, which are marked below, require a server shutdown and restart to
# take effect.
# Any parameter can also be given as a command-line option to the server, e.g.,
# "postgres -c log_connections=on".  Some paramters can be changed at run time
# with the "SET" SQL command.
# Memory units:  kB = kilobytes MB = megabytes GB = gigabytes
# Time units:    ms = milliseconds s = seconds min = minutes h = hours d = days


# The default values of these variables are driven from the -D command-line
# option or PGDATA environment variable, represented here as ConfigDir.

#data_directory = 'ConfigDir'        # use data in another directory
                   # (change requires restart)
#hba_file = 'ConfigDir/pg_hba.conf'    # host-based authentication file
                   # (change requires restart)
#ident_file = 'ConfigDir/pg_ident.conf'    # ident configuration file
                   # (change requires restart)

# If external_pid_file is not explicitly set, no extra PID file is written.
#external_pid_file = '(none)'        # write an extra PID file
                   # (change requires restart)


# - Connection Settings -

listen_addresses = '*'            # what IP address(es) to listen on;
                   # comma-separated list of addresses;
                   # defaults to 'localhost', '*' = all
                   # (change requires restart)
port = 5432                # (change requires restart)
max_connections = 100            # (change requires restart)
# Note:  Increasing max_connections costs ~400 bytes of shared memory per
# connection slot, plus lock space (see max_locks_per_transaction).  You might
# also need to raise shared_buffers to support more connections.
#superuser_reserved_connections = 3    # (change requires restart)
#unix_socket_directory = ''        # (change requires restart)
#unix_socket_group = ''            # (change requires restart)
#unix_socket_permissions = 0777        # begin with 0 to use octal notation
                   # (change requires restart)
#bonjour_name = ''            # defaults to the computer name
                   # (change requires restart)

# - Security and Authentication -

#authentication_timeout = 1min        # 1s-600s
#ssl = off                # (change requires restart)
#ssl_ciphers = 'ALL:!ADH:!LOW:!EXP:!MD5:@STRENGTH'    # allowed SSL ciphers
                   # (change requires restart)
#password_encryption = on
#db_user_namespace = off

# Kerberos and GSSAPI
#krb_server_keyfile = ''        # (change requires restart)
#krb_srvname = 'postgres'        # (change requires restart, Kerberos only)
#krb_server_hostname = ''        # empty string matches any keytab entry
                   # (change requires restart, Kerberos only)
#krb_caseins_users = off        # (change requires restart)
#krb_realm = ''                  # (change requires restart)

# - TCP Keepalives -
# see "man 7 tcp" for details

#tcp_keepalives_idle = 0        # TCP_KEEPIDLE, in seconds;
                   # 0 selects the system default
#tcp_keepalives_interval = 0        # TCP_KEEPINTVL, in seconds;
                   # 0 selects the system default
#tcp_keepalives_count = 0        # TCP_KEEPCNT;
                   # 0 selects the system default


# - Memory -

shared_buffers = 1024MB            # min 128kB or max_connections*16kB
                   # (change requires restart)
#temp_buffers = 8MB            # min 800kB
#max_prepared_transactions = 5        # can be 0 or more
                   # (change requires restart)
# Note:  Increasing max_prepared_transactions costs ~600 bytes of shared memory
# per transaction slot, plus lock space (see max_locks_per_transaction).
#work_mem = 1MB                # min 64kB
#maintenance_work_mem = 16MB        # min 1MB
#max_stack_depth = 2MB            # min 100kB

# - Free Space Map -

max_fsm_pages = 204800            # min max_fsm_relations*16, 6 bytes each
                   # (change requires restart)
#max_fsm_relations = 1000        # min 100, ~70 bytes each
                   # (change requires restart)

# - Kernel Resource Usage -

#max_files_per_process = 1000        # min 25
                   # (change requires restart)
shared_preload_libraries = '$libdir/plugins/plugin_debugger.dll'        # (change requires restart)

# - Cost-Based Vacuum Delay -

#vacuum_cost_delay = 0            # 0-1000 milliseconds
#vacuum_cost_page_hit = 1        # 0-10000 credits
#vacuum_cost_page_miss = 10        # 0-10000 credits
#vacuum_cost_page_dirty = 20        # 0-10000 credits
#vacuum_cost_limit = 200        # 1-10000 credits

# - Background Writer -

#bgwriter_delay = 200ms            # 10-10000ms between rounds
#bgwriter_lru_maxpages = 100        # 0-1000 max buffers written/round
#bgwriter_lru_multiplier = 2.0        # 0-10.0 multipler on buffers scanned/round


# - Settings -

#fsync = on                # turns forced synchronization on or off
#synchronous_commit = on        # immediate fsync at commit
#wal_sync_method = fsync        # the default is the first option
                   # supported by the operating system:
                   #   open_datasync
                   #   fdatasync
                   #   fsync
                   #   fsync_writethrough
                   #   open_sync
#full_page_writes = on            # recover from partial page writes
#wal_buffers = 64kB            # min 32kB
                   # (change requires restart)
#wal_writer_delay = 200ms        # 1-10000 milliseconds

#commit_delay = 0            # range 0-100000, in microseconds
#commit_siblings = 5            # range 1-1000

# - Checkpoints -

#checkpoint_segments = 3        # in logfile segments, min 1, 16MB each
#checkpoint_timeout = 5min        # range 30s-1h
#checkpoint_completion_target = 0.5    # checkpoint target duration, 0.0 - 1.0
#checkpoint_warning = 30s        # 0 is off

# - Archiving -

#archive_mode = off        # allows archiving to be done
               # (change requires restart)
#archive_command = ''        # command to use to archive a logfile segment
#archive_timeout = 0        # force a logfile segment switch after this
               # time; 0 is off


# - Planner Method Configuration -

#enable_bitmapscan = on
#enable_hashagg = on
#enable_hashjoin = on
#enable_indexscan = on
#enable_mergejoin = on
#enable_nestloop = on
#enable_seqscan = on
#enable_sort = on
#enable_tidscan = on

# - Planner Cost Constants -

#seq_page_cost = 1.0            # measured on an arbitrary scale
#random_page_cost = 4.0            # same scale as above
#cpu_tuple_cost = 0.01            # same scale as above
#cpu_index_tuple_cost = 0.005        # same scale as above
#cpu_operator_cost = 0.0025        # same scale as above
effective_cache_size = 4096MB

# - Genetic Query Optimizer -

#geqo = on
#geqo_threshold = 12
#geqo_effort = 5            # range 1-10
#geqo_pool_size = 0            # selects default based on effort
#geqo_generations = 0            # selects default based on effort
#geqo_selection_bias = 2.0        # range 1.5-2.0

# - Other Planner Options -

#default_statistics_target = 10        # range 1-1000
#constraint_exclusion = off
#from_collapse_limit = 8
#join_collapse_limit = 8        # 1 disables collapsing of explicit
                   # JOIN clauses


# - Where to Log -

log_destination = 'stderr'        # Valid values are combinations of
                   # stderr, csvlog, syslog and eventlog,
                   # depending on platform.  csvlog
                   # requires logging_collector to be on.

# This is used when logging to stderr:
logging_collector = on        # Enable capturing of stderr and csvlog
                   # into log files. Required to be on for
                   # csvlogs.
                   # (change requires restart)

# These are only used if logging_collector is on:
#log_directory = 'pg_log'        # directory where log files are written,
                   # can be absolute or relative to PGDATA
#log_filename = 'postgresql-%Y-%m-%d_%H%M%S.log'    # log file name pattern,
                   # can include strftime() escapes
#log_truncate_on_rotation = off        # If on, an existing log file of the
                   # same name as the new log file will be
                   # truncated rather than appended to.
                   # But such truncation only occurs on
                   # time-driven rotation, not on restarts
                   # or size-driven rotation.  Default is
                   # off, meaning append to existing files
                   # in all cases.
#log_rotation_age = 1d            # Automatic rotation of logfiles will
                   # happen after that time.  0 to disable.
#log_rotation_size = 10MB        # Automatic rotation of logfiles will
                   # happen after that much log output.
                   # 0 to disable.

# These are relevant when logging to syslog:
#syslog_facility = 'LOCAL0'
#syslog_ident = 'postgres'

# - When to Log -

#client_min_messages = notice        # values in order of decreasing detail:
                   #   debug5
                   #   debug4
                   #   debug3
                   #   debug2
                   #   debug1
                   #   log
                   #   notice
                   #   warning
                   #   error

#log_min_messages = notice        # values in order of decreasing detail:
                   #   debug5
                   #   debug4
                   #   debug3
                   #   debug2
                   #   debug1
                   #   info
                   #   notice
                   #   warning
                   #   error
                   #   log
                   #   fatal
                   #   panic

#log_error_verbosity = default        # terse, default, or verbose messages

#log_min_error_statement = error    # values in order of decreasing detail:
                   #   debug5
                   #   debug4
                   #   debug3
                   #   debug2
                   #   debug1
                   #   info
                   #   notice
                   #   warning
                   #   error
                   #   log
                   #   fatal
                   #   panic (effectively off)

#log_min_duration_statement = -1    # -1 is disabled, 0 logs all statements
                   # and their durations, > 0 logs only
                   # statements running at least this time.

#silent_mode = off            # DO NOT USE without syslog or
                   # logging_collector
                   # (change requires restart)

# - What to Log -

#debug_print_parse = off
#debug_print_rewritten = off
#debug_print_plan = off
#debug_pretty_print = off
#log_checkpoints = off
#log_connections = off
#log_disconnections = off
#log_duration = off
#log_hostname = off
log_line_prefix = '%t '            # special values:
                   #   %u = user name
                   #   %d = database name
                   #   %r = remote host and port
                   #   %h = remote host
                   #   %p = process ID
                   #   %t = timestamp without milliseconds
                   #   %m = timestamp with milliseconds
                   #   %i = command tag
                   #   %c = session ID
                   #   %l = session line number
                   #   %s = session start timestamp
                   #   %v = virtual transaction ID
                   #   %x = transaction ID (0 if none)
                   #   %q = stop here in non-session
                   #        processes
                   #   %% = '%'
                   # e.g. '<%u%%%d> '
#log_lock_waits = off            # log lock waits >= deadlock_timeout
#log_statement = 'none'            # none, ddl, mod, all
#log_temp_files = -1            # log temporary files equal or larger
                   # than specified size;
                   # -1 disables, 0 logs all temp files
#log_timezone = unknown            # actually, defaults to TZ environment
                   # setting


# - Query/Index Statistics Collector -

#track_activities = on
#track_counts = on
#update_process_title = on

# - Statistics Monitoring -

#log_parser_stats = off
#log_planner_stats = off
#log_executor_stats = off
#log_statement_stats = off


#autovacuum = on            # Enable autovacuum subprocess?  'on'
                   # requires track_counts to also be on.
#log_autovacuum_min_duration = -1    # -1 disables, 0 logs all actions and
                   # their durations, > 0 logs only
                   # actions running at least that time.
#autovacuum_max_workers = 3        # max number of autovacuum subprocesses
#autovacuum_naptime = 1min        # time between autovacuum runs
#autovacuum_vacuum_threshold = 50    # min number of row updates before
                   # vacuum
#autovacuum_analyze_threshold = 50    # min number of row updates before
                   # analyze
#autovacuum_vacuum_scale_factor = 0.2    # fraction of table size before vacuum
#autovacuum_analyze_scale_factor = 0.1    # fraction of table size before analyze
#autovacuum_freeze_max_age = 200000000    # maximum XID age before forced vacuum
                   # (change requires restart)
#autovacuum_vacuum_cost_delay = 20    # default vacuum cost delay for
                   # autovacuum, -1 means use
                   # vacuum_cost_delay
#autovacuum_vacuum_cost_limit = -1    # default vacuum cost limit for
                   # autovacuum, -1 means use
                   # vacuum_cost_limit


# - Statement Behavior -

#search_path = '"$user",public'        # schema names
#default_tablespace = ''        # a tablespace name, '' uses the default
#temp_tablespaces = ''            # a list of tablespace names, '' uses
                   # only default tablespace
#check_function_bodies = on
#default_transaction_isolation = 'read committed'
#default_transaction_read_only = off
#session_replication_role = 'origin'
#statement_timeout = 0            # 0 is disabled
#vacuum_freeze_min_age = 100000000
#xmlbinary = 'base64'
#xmloption = 'content'

# - Locale and Formatting -

datestyle = 'iso, dmy'
#timezone = unknown            # actually, defaults to TZ environment
                   # setting
#timezone_abbreviations = 'Default'     # Select the set of available time zone
                   # abbreviations.  Currently, there are
                   #   Default
                   #   Australia
                   #   India
                   # You can create your own file in
                   # share/timezonesets/.
#extra_float_digits = 0            # min -15, max 2
#client_encoding = sql_ascii        # actually, defaults to database
                   # encoding

# These settings are initialized by initdb, but they can be changed.
lc_messages = 'Russian_Russia'            # locale for system error message
                   # strings
lc_monetary = 'Russian_Russia'            # locale for monetary formatting
lc_numeric = 'Russian_Russia'            # locale for number formatting
lc_time = 'Russian_Russia'                # locale for time formatting

# default configuration for text search
default_text_search_config = 'pg_catalog.russian'

# - Other Defaults -

#explain_pretty_print = on
#dynamic_library_path = '$libdir'
#local_preload_libraries = ''


#deadlock_timeout = 1s
max_locks_per_transaction = 150        # min 10
                   # (change requires restart)
# Note:  Each lock table slot uses ~270 bytes of shared memory, and there are
# max_locks_per_transaction * (max_connections + max_prepared_transactions)
# lock table slots.


# - Previous PostgreSQL Versions -

#add_missing_from = off
#array_nulls = on
#backslash_quote = safe_encoding    # on, off, or safe_encoding
#default_with_oids = off
#escape_string_warning = on
#regex_flavor = advanced        # advanced, extended, or basic
#sql_inheritance = on
#standard_conforming_strings = off
#synchronize_seqscans = on

# - Other Platforms and Clients -

#transform_null_equals = off


#custom_variable_classes = ''        # list of custom variable class names
вот мои настройки
25 valeriy vm
только у меня УПП конфа снятая с поддержки
26 dimawrx
(24) Спасибо
Попробую поставить shared_buffers = 1024MB, остальное вроде бы по умолчанию.
ну и на следующей неделе запущу на Linux'e
Программист всегда исправляет последнюю ошибку.