OFF: Задачка по теории вероятности.

LIFE

04.12.13

✎

14:22

1С-ник на своей большой базе выбрал случайный документ. Нумерация документов стандартная без префиксов.
Какая вероятность того, что первая цифра в номере этого документа начинается с 1?

1 1Сергей

04.12.13

✎

14:24

1/10

2 andrewalexk

04.12.13

✎

14:24

:) 1:10?

3 Повелитель

04.12.13

✎

14:24

4 andrewalexk

04.12.13

✎

14:25

:) или 1/9

5 ДенисЧ

04.12.13

✎

14:25

1/2

6 Wobland

04.12.13

✎

14:25

лучше скажи, как твой 1Сник это сделал

7 aka MIK

04.12.13

✎

14:25

Точно не 1/10, поболее. Нужно мат. моделирование

8 Krendel

04.12.13

✎

14:26

(1) Стандарт у всех свой ;-)

9 KishMish

04.12.13

✎

14:26

в зависимости от последнего (максимального) номера.
может быть "большая база" у него где все документы с
000000000001 по
199999999999
дата ближе к 1/2

10 Mikeware

04.12.13

✎

14:27

незначащие нули считаются?

11 Wobland

04.12.13

✎

14:27

цифр 10 штук, какова вероятность попасть в одну? что вы, как дети малые?

12 NcSteel

04.12.13

✎

14:27

почти 100% первая цифра будет "0"....

13 Asirius

04.12.13

✎

14:27

(10) Нули, естественно, отбросить

14 andrewalexk

04.12.13

✎

14:27

(9) :) раз максимальный номер не оговорен то просчитывай для произвольного, при макс. номер->inf, P->10% имхо

15 NcSteel

04.12.13

✎

14:28

(11) ну дык номера то такие 0000000001 )))

16 andrewalexk

04.12.13

✎

14:28

(13) :) тогда к 1/9

17 Wobland

04.12.13

✎

14:28

(15) и что?

18 Mikeware

04.12.13

✎

14:29

(13) тогда достаточно точно считается по размеру базы

19 Mikeware

04.12.13

✎

14:30

(16) нифига
для 20 документов в базе вероятность начала с 1 будет 1/2

20 Asirius

04.12.13

✎

14:30

(9), (14) Можно уточнить: случайный одинэсник на случайной базе. Т.е. количество документов случайно

21 Krendel

04.12.13

✎

14:30

(5) ты все таки прав, тут умные люди гадают, а ответов на вопрос всего 2, или цифра 1 есть или ее нету

22 Mikeware

04.12.13

✎

14:31

(20) ну тогда вероятность тоже случайна,от 0 до 1

23 andrewalexk

04.12.13

✎

14:31

(19) :) при макс = 100, P->1/9..

24 Lama12

04.12.13

✎

14:31

(0)А длина номера какая?

25 NcSteel

04.12.13

✎

14:32

(17) Ну как бы первая цифра с большей вероятностью равна именно "0", я баз где не так не видел )

26 Кай066

04.12.13

✎

14:32

конфа какая?))

27 Asirius

04.12.13

✎

14:32

(22) Не, допусктим мы сейчас выберем случайного участника форума и попросим выбрать случайный документ. Ставлю больге 20%, что результат в первой цифре будет 1

28 NcSteel

04.12.13

✎

14:33

(26) Если конфа не озвучена то по умолчанию БП 2.0

29 NcSteel

04.12.13

✎

14:33

(27) будет ноль )

30 Asirius

04.12.13

✎

14:34

(29) нули отбрасываем

31 Кай066

04.12.13

✎

14:35

(27) ставки в процентах не принимаются

32 Lama12

04.12.13

✎

14:35

(27) Могу быть "случайным" участником форума.
Принимаю предложения о "правильной" цифре.

33 Mikeware

04.12.13

✎

14:35

(27) первая цифра 5. с тебя 10 баксов.

34 Asirius

04.12.13

✎

14:36

можно провести эксперимент.
Пишем обработку, которая выбирает случайную счет-фактуру в БП2.0 и выводит ее первый номер.
Все скачивают и запускают на своих базах, скидывают результаты
Я утверждаю, что 1 будет встречаться гораздо чаще остальных

35 Asirius

04.12.13

✎

14:38

(34) +каждый запускает ровно 1 раз

36 Sorm

04.12.13

✎

14:38

(0) Для случайной базы 0.1

37 aka MIK

04.12.13

✎

14:39

В моей базе получилось 30%...

800 тыщ документов (остальные 200 тыщ - с префиксами, но думаю статистика сильно не изменится)

38 andrewalexk

04.12.13

✎

14:40

:) тут еще от дискретности или предела зависит
например для экспоненциальной шкалы получаем дискретный ряд:
10=2:10
100=12:100
1000=112:1000
10000=1112:10000
..который стремится к 1/9

39 Asirius

04.12.13

✎

14:45

Если в базе ~X*10^n документов, то вероятность для базы уже не 1/9 а где-то 1/x
(x - цифра от 1 до 9)
С некоторой вероятнотностью мы ткнем в базу, где вероятность выбать 1 составляет 1/2
С некоторой вероятнотностью мы ткнем в базу, где вероятность выбать 1 составляет 1/3
итд
сумма этих вероятностей никак не может быть 1/9, т.к 1/9 это минимум

40 Asirius

04.12.13

✎

14:47

(37) Вот это похоже на правду

41 andrewalexk

04.12.13

✎

14:50

:) согласен, нижний предел равен 1/9

42 NS

04.12.13

✎

14:52

Совсем же недавно было на форуме. 30%.
wiki:Закон_Бенфорда

43 Серго62

04.12.13

✎

14:54

(0)Это зависит от длины номера

44 aka MIK

04.12.13

✎

14:55

(0) На моей почищенной от префиксов базе получилось 29%

45 Gantosha

04.12.13

✎

14:55

(42) а нули перед номером куда делись ?

46 NS

04.12.13

✎

14:56

(42) Читаем ветку. Например (30)

47 NS

04.12.13

✎

14:56

(46) -> (45)

48 andrewalexk

04.12.13

✎

14:57

(42) :) ну не знаю...
для линейной шкалы от 1 до 100 получаем:
1:1/1=1
2:1/2=0.5
3:1/3=0.333
4:1/4=0.25
...
99:11/99=0.111
средняя
100:12/100=0.12

49 Pahomich

04.12.13

✎

14:58

(0) 0.5 +- 0.5

50 Gantosha

04.12.13

✎

14:59

а вероятность в % измеряется )

51 NS

04.12.13

✎

15:01

(48) Ты питаешься опровергнуть законы мат. статистики? :)
0.12?
Упрощаем задачу. Длина номера 1. Количество документов в базе случайно, равномерно распределено, нумерация документов по порядку. Какова вероятность что первая единица?

52 NS

04.12.13

✎

15:02

(50) Вероятность измеряется и в процентах, и в долях.

53 Gantosha

04.12.13

✎

15:03

(52) не помню что бы хоть в одном приличном учебнике написали
вероятность события = сколько то %

54 andrewalexk

04.12.13

✎

15:04

(51) :) .. проверить

55 lamesnake

04.12.13

✎

15:04

(10) Них...чего себе уточнение. Да ешё и "естественно".

56 andrewalexk

04.12.13

✎

15:04

(53) :)) пту финишд?

57 lamesnake

04.12.13

✎

15:05

(55) к (13)

58 Sabbath

04.12.13

✎

15:06

(0) теория вероятностЕЙ кстати

59 NS

04.12.13

✎

15:06

(54) Что проверить? Элементарная задача. Ответ 0.5. 50%.

60 Серго62

04.12.13

✎

15:07

(53) А че мешает ее в процентах выразить?
Если подбросить например монету (и исключить те случаи когда она встанет на ребро или зависнет в воздухе), то вероятность выпадения орла или решки 50%. Я не прав?

61 NS

04.12.13

✎

15:08

(60) По определению процент - одна сотая доля. Конечно прав.

62 Sabbath

04.12.13

✎

15:08

(13) если нули "естественно" отбросить, то почему в условии не сказано, сколько символов в номере максимально?

63 andrewalexk

04.12.13

✎

15:09

(59) :) сам себе противоречишь, см (42)

64 Torquader

04.12.13

✎

15:10

Пусть размер базы P (количество документов)
P=(10^N)+L
где N - максимальная степень десяти
0<=L<(9*10^N)-1
Мы выбираем случайное целое число [0,P]
Пусть V - вероятность встретить единицу
В массиве мы имеем равномерный участок 1/9 (на 10^N-1 документе)
Вероятность 1 при условии от 10^N до MIN(L,10^N)
Вероятность 0 при условии от 10^N до (9*10^N)-1
Теперь суммируем:
((1/9)*(10^N-1)+MIN(L,10^N))/((10^N)+L)

Теперь рассмотрим это выражение.
Поскольку L разномерно распределено от 0 до (9*10^N)-1,
то от N зависимости быть не должно,
то все расчёты проведём при N=2,
(так как при N=1 нет предыдущего куска с 1/9).
((1/9)*(99)+MIN(L,100))/(100+L), где 0<=L<=899
То есть (9+MIN(L,100))/(100+L) - пишем программу и считаем

0.235936098089893

65 Принт

04.12.13

✎

15:11

(56) маргинал?

66 Серго62

04.12.13

✎

15:11

(51) Если количество документов неизвестно, то как посчитать вероятность? Если документов 2, то 1/2, если 3, то 1/3 или я что то путаю?

67 NS

04.12.13

✎

15:11

(59) (63) Я там немного ошибся.
(1+1/2+1/3+1/4+1/5+1/6+1/7+1/8+1/9) /9 = 0.31432980599647266314
То есть 31.43%
И в условии не один знак.

68 NS

04.12.13

✎

15:12

(66) см. (42)

69 Torquader

04.12.13

✎

15:12

Наврал (11+MIN(L,100))/(100+L) => 0.241062972185251

70 andrewalexk

04.12.13

✎

15:13

(65) :) я его про это и спросил

71 Птица

04.12.13

✎

15:13

(58)+1. Именно, а то думала, только мне глаз режет

72 Принт

04.12.13

✎

15:14

(70) я окончил пту и знаю, что вероятность измеряется в процентах. кто ограничен?

73 Torquader

04.12.13

✎

15:15

(72) Вероятность - число от 0 до 1, конечно, можно измерять в процентах, но смысл от этого не меняется.

74 NS

04.12.13

✎

15:20

(73) Вероятность измеряется в долях. Процент это одна сотая доля.

75 Torquader

04.12.13

✎

15:24

http://www.testent.ru/publ/studenty/vysshaja_matematika/klassicheskoe_opredelenie_verojatnosti/35-1-0-1121

76 andrewalexk

04.12.13

✎

15:24

(72) :) ты и ваш препод по теорверу
зы
есть еще вопросы?

77 Принт

04.12.13

✎

15:26

(76) false positive

78 Torquader

04.12.13

✎

15:27

(76) На самом деле, это отношение двух чисел, где числитель всегда не больше знаменателя - очень похоже на определение процента.

79 Torquader

04.12.13

✎

15:28

Вы лучше не спорьте, а мои рассуждения проверьте - может быть я где-то облажался (просто сначала у меня получилось число явно большее 1 и пришлось пересчитывать).

80 Gantosha

04.12.13

✎

15:28

слушайте, ну откройте учебник Боровкова - у меня ее нет - найдите любую задачу по комбинаторике в общем на классическую вероятность .. там могут быть проценты в описании, и поищите их. Я вот открыл Феллера и на нашел процентов.

81 Torquader

04.12.13

✎

15:30

(80) Процент - это сотая доля числа - так что в процентах можно выразить всё.
Но в учебниках обычно вероятность обозначают дробью, так как периодическая десятичная запись не катит.
Например, вероятность вытащить один шар из трёх равна 1/3 или 33.(3)% - второе как-то не сразу понятно.

82 Gantosha

04.12.13

✎

15:31

(79) ну теперь N погоняй до 9 и найди сумму. Скорее всего ответ и сойдется к тому что там кто то уже решил .. так как в общем то понятно , что числа не случайны по своему появлению.

83 NS

04.12.13

✎

15:31

На трех станках-автоматах обрабатываются однотипные детали, поступающие после обработки на общий конвейер. Первый станок дает 2% брака, второй – 7%, третий – 10%. Производительность первого станка в 3 раза больше производительности второго, а третьего – в 2 раза меньше, чем второго.
http://www.matburo.ru/tvbook_sub.php?p=par16

84 andrewalexk

04.12.13

✎

15:31

(77)(78) :) речь про (53)

85 NS

04.12.13

✎

15:31

(79) см. (42) (67)

86 NS

04.12.13

✎

15:32

В (83) Задача из учебника. Вероятность указана в процентах.

87 Torquader

04.12.13

✎

15:35

(86) Если задача про брак, то там всегда будут проценты, так как его просто ни в чём другом не измеряют.

88 Gantosha

04.12.13

✎

15:38

вообще , забавно вы тролитесь. Самолюбие такая штука.

89 andrewalexk

04.12.13

✎

15:39

(88) :) http://xmage.ru/images/jdcd.jpg
?

90 NS

04.12.13

✎

15:39

(87) Брак - это вероятность. Вероятность брака. И измеряют вероятность естественно в процентах. Так как процент это всего лишь одна сотая доля.

91 Torquader

04.12.13

✎

15:39

(82) По N я погонял - разницы нет (в пятом-шестом знаках).

92 Gantosha

04.12.13

✎

15:40

(89) я не очень понимаю что там нарисовано - пояснение будет ?

93 Gantosha

04.12.13

✎

15:41

(91) сумму надо считать по всем N

94 Torquader

04.12.13

✎

15:41

(90) КДП тоже все привыкли мерить в процентах, но это также число - процент можно рассматривать как одну из форм записи числа.

95 NS

04.12.13

✎

15:42

(94) Процент это не форма записи числа. Это одна сотая доля.

96 andrewalexk

04.12.13

✎

15:42

(92) :) это иллюстрация мотивации (88)

97 Torquader

04.12.13

✎

15:42

(93) Зачем ?
Если считать по всем N, то проще записать Сумма(V(i))/P где i от 1 до P

98 NS

04.12.13

✎

15:44

Вероятностью события A называют отношение числа m благоприятствующих этому событию исходов к общему числу n всех равновозможных несовместных элементарных исходов, образующих полную группу.

Отношение - это доля. А доли мы естественно можем записывать в сотых долях, в процентах.

99 Gantosha

04.12.13

✎

15:44

(96) а ..поянтно.

100 Torquader

04.12.13

✎

15:45

Кстати, большая база - это максимальная длина номера, а номер всего-то 20 символов, так что можно сразу положить, что N=20 и посчитать.

101 NS

04.12.13

✎

15:46

(64) "где 0<=L<=899"
Что-то мне подсказывает что целое трехзначное число 100<=L<=999, а среднее число не более трех знаков
1<=L<=999.
Что такое 899?

102 Gantosha

04.12.13

✎

15:48

(97) у вас N (длина номера) не зафиксирована и может быть любой. Поэтому по всем надо считать .

103 Torquader

04.12.13

✎

15:52

(101) Число у нас от 1 до 999 или 99 чисел (предыдущий случай) и 900 чисел этого уровня.
Из 99 вероятность единицы будет 1/9.
из 900 оставшихся получается 1 для 99 чисел и 0 для остальных.
Добавляя знак (увеличивая N) мы просто растягиваем отрезок - соотношение остаётся тем же самым.
Поэтому N просто отбросили и усреднили по хвосту числа.

104 NS

04.12.13

✎

15:54

(103) При этом напутав где только можно.
Написать тебе программу, которая считает среднюю вероятность первой единице при количестве номеров равномерно распределенных между 1 и 999? Она выдаст совсем другой результат.

105 andrewalexk

04.12.13

✎

15:56

(104) :) напиши...а то у меня получается (16)

106 NS

04.12.13

✎

15:59

(105) (16) ну никак получится не может.
Но и в (64) всё верно. 0.24290004193316073052

//*******************************************
Процедура Сформировать()
    // цикл по количеству номеров
    вер=0;// всего 999 случаев
    Для кол=1 по 999 Цикл
        // цикл по всем номерам.
        колвоСединицы=0; // всего кол
        Для а=1 по кол  Цикл
            Если лев(строка(а),1)="1" Тогда
                колвоСединицы=колвоСединицы+1;
            КонецЕсли;
        КонецЦикла;
        вер=вер+колвоСединицы/кол;
    КонецЦикла;
    сообщить(вер/999)
КонецПроцедуры

107 Torquader

04.12.13

✎

15:59

(104) Так она и выдаст другой результат.
Чтобы получить результат нужно просуммировать вероятность получения первой единицы для N от 1 до 999.
V(999)=0.(1) - естественно, что отличается.

108 Torquader

04.12.13

✎

16:00

G=0
A=0
For i=1 To 999 Step 1
    s=CStr(i)
    If Left(s,1)="1" Then G=G+1
    A=A+1
Next
MsgBox CStr(G/A),0,"OK"

109 NS

04.12.13

✎

16:01

Так как распределение равномерное. А правильно брать как в (42) - равномерно распределенный логарифм?
(107) ?!?

110 NS

04.12.13

✎

16:02

(109) В конце первого предложения восклицательный знак, а не вопросительный. :)

111 Torquader

04.12.13

✎

16:02

Function P(N)
    Dim A
    Dim G
    Dim i
    A=0
    G=0
    For i=1 To N Step 1
        A=A+1
        If Left(CStr(i),1)="1" Then G=G+1
    Next
    P=G/A
End Function

Q=0
M=0
For j=1 To 999 Step 1
    M=M+1
    Q=Q+P(j)
Next
MsgBox CStr(Q/M),0,"OK"

0.242900041933161

112 Asirius

04.12.13

✎

16:04

(111) Правильный ответ по формуле из (42)
Log 2 =~0,30102...

113 Asirius

04.12.13

✎

16:05

(111) У тебя скорее ошибка в том, что не учтена сама вероятность N

114 NS

04.12.13

✎

16:10

(113) см. (109)

115 Torquader

04.12.13

✎

16:11

(112) В законе Бенфорда говорится, что величина растёт экспоненциально, а число документов растёт вполне линейно.

116 Torquader

04.12.13

✎

16:13

(113) Вероятность N у меня учтена, но я считал, что появление каждого варианта (0..N) равномерно, а в формуле Бенфорда они считают появление варианта по экспоненте, то есть запись перевели в логарифмическую шкалу и уже по ней размазали линейно.
Тогда получается другой ответ, но у нас, на самом деле, и множество конечно и шкала линейная.

117 andrewalexk

04.12.13

✎

16:14

(106) :) это частный случай...у меня тоже при 999 так...а при 1000 уже меньше...и скорее всего стремится к 1/9

118 Asirius

04.12.13

✎

16:16

(114) (115)
Для баз данных документов правильнее брать логарифмическое распределение.
Мы рассматриваем не конкретную базу, а совокупность всех баз.

При равномерном распределении количество баз, в которых до 1000 документов будет слишком мало по сравнению с базами, в которых от 100 тысяч до 1 миллиона документов, хотя на практике это не так

119 NS

04.12.13

✎

16:17

(117) Не стремится к 1/9 даже при равномерном распределении.
(115) Количество номеров в системе, по разным фирмам - естественно распределено экспоненциально.

120 fmrlex

04.12.13

✎

16:17

(0)Т.к. не указано распределение, не указан метод выборки,
в общем случае 1/К,
где К - кол-во доков

121 NS

04.12.13

✎

16:19

(120) Во это да. Из любого количества номеров, без учета лидирующих нулей, с единицы начинается только один?

122 Asirius

04.12.13

✎

16:25

+(118) Хотя с гноблением малого бизнеса в России, возможно что статистика будет искажена в сторону более крупных баз.

123 Одесса

04.12.13

✎

17:12

Ничего не имея против закона Бенфорда как такового, скажу лишь, что формулировка задачи не вполне корректная, поскольку не дано никакой значимой информации, кроме указания на то, что база большая. Поэтому, если не дополнять исходные условия, то решить её методами теории вероятности проблематично. Либо можно получить парадоксальные результаты.

124 NS

04.12.13

✎

17:14

(123) Разумное предположений может быть только одно. Логарифм количества номеров распределен равномерно. Просто равномерное распределение количества номеров явно неразумно, ибо тогда нужна верхняя граница для распределения. И единственным разумным ответом получается (42)

125 Одесса

04.12.13

✎

17:20

(124) Обоснуй.
Я же имел ввиду, что в условии задачи не хватает информации, каков был порядок присвоения номера документу: как в 1С - последовательная нумерация, либо номера назначались случайным образом по какому либо правилу или следуя какому-либо распределению. Все это БАЗОВЫЕ условия, от которых зависит ответ на вопрос. Например, при последовательной нумерации никакого распределения Бенфорда для первой цифры не будет и в помине.

Без уточнения того, как нумеровались документы, решать эту задачу - все равно что гадать какова вероятность встретить на улице динозавра (либо встречу, либо нет, значит 1/2) либо подсчитывать вероятность выпадения орла, ничего нне зная о том, симметрична монета или нет.

126 Mikeware

04.12.13

✎

17:22

(124) а для недесятеричной системы счислени? :-)

127 NS

04.12.13

✎

17:24

(125) Допустим номера присваиваются случайно.
Какие разумные варианты распределения есть?

128 NS

04.12.13

✎

17:24

(126) Это другая задача.

129 Mikeware

04.12.13

✎

17:26

(128) не совсем. сводится к (0) :-)

130 Mikeware

04.12.13

✎

17:28

(127) иэх. чот думать даже лень

131 NS

04.12.13

✎

17:31

Что дано. Номеров много, то есть количество не ограничено сверху, у распределения либо не должно быть параметров, либо результат не должен от них зависеть. Вижу только один вариант - экспоненциальное распределение номеров.

132 Одесса

04.12.13

✎

17:32

(127) Мало сказать "присваиваются случайно", надо конкретизировать, как именно: равномерно в каком-то интервале номеров или, например "по Гауссу" :)
Если абстрагироваться, то любой вариант распределения можно считать разумным, а если вспомнить про то, что упоминается 1С, то логично предположить равномерное распределение. Потому и говорю, что в условии задачи не хватает такого рода уточнения.
Если же ты априори задаешь равномерное распределение для логарифмов номеров, то только в этом случае ты и получишь что-то близкое к Бенфорду (тем точнее, чем больше максимальная длина номера).

133 Torquader

04.12.13

✎

17:33

(127) Если номера присваиваются случайно, то мы будем ближе к 1/9.
А в 1С, кстати, документы нумеруются в пределах года, так что вопрос ещё более сложен.

134 Torquader

04.12.13

✎

17:34

(131) Ну, для номеров документов более подходит нормальное распределение, так как размер базы, всё-таки, ограничен и длина номера также.

135 NS

04.12.13

✎

17:35

(131) правильней наверно говорить - экспоненциальный рост.

136 NS

04.12.13

✎

17:36

(134) В условии нет параметров.

137 Одесса

04.12.13

✎

17:36

(131) Почему экспоненциальное, а не квадратичное? Или, например, чем гамма-функция хуже экспоненты? опять же, каждый этот случай будет иметь свой ответ и он будет правильным (именно для рассматриваемого случая).

Спорить о том, какое распределение лучше смысла не имеет.

138 NS

04.12.13

✎

17:36

Если бы речь шла о нормальном распределении - в условии обязательно были бы параметры. То же самое с равномерным.

139 Одесса

04.12.13

✎

17:37

(136) В условиях вообще ничего нет, кроме 1Сника )))

140 Torquader

04.12.13

✎

17:40

И, кроме того, уточняется, что база "большая", а закон Бенфорда (как сказано)
http://матметоды.рф/zakon-benforda/
никак не соотносится с размером базы.
Предполагается, что выборка документа ИЗ ЛЮБОЙ БАЗЫ будет давать первую цифру по закону Бенфорда.

141 Torquader

04.12.13

✎

17:43

То есть, если в условии задачи поставить "рабочая база", то тогда номера документов предполагаются соответствующими этому закону.
Можно ли считать, что большая база = рабочая база, или большая база, это когда счётчик номера близок к максимальному значению ?

142 andrewalexk

04.12.13

✎

17:44

:) кстати прикольная функция получается
http://yadi.sk/d/y8w-D9DmDnWjR

143 rphosts

04.12.13

✎

17:56

(0) для решения задачи необходима ещё куча данных, например нумератор имеет какой тип? Если строка, то задача для решения требует дополнительных сведений.

144 Torquader

04.12.13

✎

18:01

(143) Первая цифра в строке номера (префиксы и нули изначально отбрасываются).
Вообще - получается так - что следование чисел по времени - экспоненциальное распределение, а сложенные воедино множество факторов дают нормальное распределение (на которое закон Бенфорда не распространяется).
Поскольку для "больших баз" мы можем определить среднюю длину номера (как половину максимальной), то распределение всё-таки экспоненциальным не является.
И тогда нужно считать интеграл по вероятности нормального распределения от функции вероятности единицы для заданного количества документов.

145 Одесса

04.12.13

✎

18:04

(143) Если число, то тоже требует. Народ в комментариях эти сведения и придумывеает.

Но если под словом "большая база" подразумевать большое количество документов-ссылок среди большого количества ВИДОВ документов и то, что количество документов каждого вида есть случайная величина, распределенная по некому закону (равномерно? лог-равномерно или еще как?), то тогда задачу уже можно решать.

146 NS

04.12.13

✎

18:39

(140) Естественно не из любой, а средняя вероятность по выборке из большого количества разных баз.

147 uno-group

04.12.13

✎

18:54

Объяснение закона Бенфорда также заключается в том, что многим величинам (не всем) этого мира свойственен экспоненциальный рост, а не линейный.
Нумерация документов растет линейно. в 7.7 максимальная длина номера 20 знаков. И документы зависят друг от друга и их количество как то связано между собой. И самое е это то что журнал откроется и с позиционируется или в начало периода или в конец

148 NS

04.12.13

✎

19:06

(147) Речь не про то как растет нумерация документов, а про то как распределен среди баз максимальный номер.

149 MKZM

04.12.13

✎

19:09

(148) почему максимальный?

150 Одесса

04.12.13

✎

20:07

Кстати, ситуация с распределением Бенфорда легко моделируется даже на одной не обязательно очень большой базе. Надо только, чтобы периодичность нумерации была, скажем, месяц и возраст базы был бы не меньше пары-тройки лет (чем больше периодов в базе, тем лучше будет приближение к Бенфорду). При сквозной последовательной нумерации в рамках документа одного вида Бенфорда не получить. Ну, опять же, это все доп. условия, которыми мы дополняем условия исходной задачи, исходя из своего представления о "типичной" базе 1С.

151 NS

04.12.13

✎

20:19

(149) как распределен максимальный, так будет распределен и случайный.

152 Torquader

04.12.13

✎

20:53

Случайный мы выбираем равновероятно из отрезка [1,Max] поэтому, вероятность получить какой-то элемент равна 1/Max.
Дальше, на самом деле, количество документов зависит от размера фирмы - причём практически линейно.
Соответственно, если мы отсеиваем мелкие фирмы, коих много, то остаются солидные конторы, количество которых с ростом размера стремиться к нулю (например, конторы больше чем Microsoft и т.п. нет, хотя и там нет 1С).
Другими словами, у размера фирмы есть явное ограничение сверху, что предполагает и ограничение на количество документов.
Ну и получается, что распределение фирм явно не лезет в экспоненту, которая просто в случае количества документов за периоды (разные) могла бы получиться.

153 MKZM

04.12.13

✎

20:54

(150) А по теории вероятности верность верности модели как определяется?

154 MKZM

04.12.13

✎

20:55

Просто на нее умножать надоть. Или нет?

155 Gantosha

05.12.13

✎

09:20

не хочется делать новую тему ..ну так вот про статику.
И так всем образованным людям известно, что самолет более безопасный транспорт чем автомобиль. Цифры расчета основаны на статистике гибели людей при перевозки их на тысячу километров (порядок там выше конечно). Это конечно прекрасно и логично с одним но. Доля количества самолетов которое заканчивает тоталом больше чем доля машин которое заканчивает тоталом. (цифры из головы - но мне кажется у самолетов это процента 2% от парка, у машин цифра ниже). Так вот если считать время до гибели в самолете или машине, то при использовании километража самолет выигрывает, а вот если перейти просто к бытовому использованию т.е. например сутра вы выбираете добираться в магазин или на работу на машине или самолете , то ситуация будет не в пользу самолета. И люди отчетливо это чувствуют .. вчера у одного самолета была аварийная посадка .. так вот потом народ долго сажали в этот самолет.

Ошибка? Это не ошибка, это системная функция.