Что-нибудь влияет на эволюцию вашего покемона?

Когда покемон эволюционирует, его быстрые и быстрые движения перебрасываются в соответствии с неизвестными шансами.

Когда покемон эволюционирует, его быстрые и быстрые движения перебрасываются в соответствии с неизвестными шансами. Принято считать, что ходы выбираются случайным образом из тех, что доступны этому виду покемонов. К сожалению, ни одно исследование серьезно не изучало факторы эволюционного набора движений, и из-за отсутствия этих данных мифы и слухи сохраняются.

К счастью, группа Silph Research присмотрелась!

Когда покемон эволюционирует, его быстрые и быстрые движения перебрасываются в соответствии с неизвестными шансами. Исследователи Silph начали записывать различные атрибуты своих покемонов до эволюции, включая их движения, оценки, звездную пыль и их эволюционные наборы движений. В ходе исследования было зафиксировано более 10 000эволюций.

Выводы

После тщательного изучения группа Silph Research пришла к двум важным выводам:

Вывод №1:

Мы не нашли доказательств корреляциимежду следующими факторами и постэволюционными движениями:

Фактор изучен Корреляция обнаружена?
Доэволюционный Quick Move Нет
Движение заряда до эволюции Нет
Команда тренера Нет
Уровень покемона (приблизительно с использованием стоимости усиления Звездной пыли) Нет
Покемон по прозвищу во времена эволюции Нет
Счастливое яйцо активировано во время эволюции Нет
Общая оценка Нет
Высшая категория (-ы) IV (атака, защита или выносливость) Нет
Покемон имеет идеальные IV в атаке, защите или выносливости (отдельно) Нет
Независимо от того Pokemon имеет любой совершенный IV Нет
Есть ли у покемона все идеальные IV Нет*

Наша исходная гипотеза ( нулевая гипотеза) состоит в том, что после эволюции быстрое движение покемона и движение рывка выбираются равномерно случайным образом из доступных ходов, то есть каждый ход одинаково вероятен и выбирается случайным образом из доступных ходов. .

Данные показывают, что из рассмотренных нами эффектов ни один невызвал значительного отклонения от случайного равномерного выбора. Это показывает, что ни один из рассмотренных выше факторов не оказал значимого влияния на постэволюционный набор движений.

Вывод №2:

Мы обнаружили, что наборы движений равномерно, случайным образом распределеныпосле эволюции, то есть, если у вида есть 3 возможных хода заряда после эволюции, каждый ход с вероятностью 33,3% станет новым ходом покемона.

Итак, путешественники, если вы видите какие-либо мифы об эволюции, распространяющиеся вокруг, поделитесь знаниями: они действительно случайны и, как правило, имеют равные шансы каждый раз. И это уже не догадка!

* Данные были скудны в группе выборки всех идеальных IV , поэтому, хотя наши данные не показали противоречия с равномерным распределением случайных перемещений, возможно, что больше данных может противоречить этой тенденции.

Нулевая гипотеза и методология

Каждый потенциально коррелированный предэволюционный атрибут исследовался по отдельности. Для каждой возможной корреляции нулевая гипотезаприменяется к каждой перестановке видов и рассматриваемой переменной.

Например, рассмотрим гипотетическую корреляцию « Команда тренеров». Начиная с Бульбазавра в «Мистике», нулевая гипотеза гласит, что около одной трети движений заряда будет Слудж Бомбой, когда он эволюционирует до Ивисавра. Это был бы единственный тест для нашей гипотезы, сравнивая наш наблюдаемый подсчет с распределением, ожидаемым нулевой гипотезой.

Поскольку существует подобный тест для каждой перестановки переменных до эволюции, существует очень большое количество тестов. Каждый тест состоит из начального вида, проверяемой независимой переменной и постэволюционного хода. (См. Примечание 1). Затем был проведен анализ всей системы тестов в целом, чтобы увидеть, влияет ли какой-либо из предполагаемых факторов на несколько видов.

Учитывая нулевую гипотезу, можно вычислить показатель экстремальности для каждого теста. Если нулевая гипотеза верна, экстремальность должна быть случайным и равномерно распределена между 0 и 1. (См. Примечание 2). Однако, если существует систематическая связь между любой независимой переменной и постэволюционными движениями, распределение экстремальности будет отклоняться от равномерное распределение.

Таким образом, мы можем проверить нашу нулевую гипотезу, проверив, выводятся ли наши значения экстремальности из равномерного распределения. Это было проведено с использованием теста Андерсона-Дарлинга.

Чтобы проиллюстрировать, как проводился этот тест, мы покажем результаты переменной « Trainer Team» на каждом этапе:

Шаг 1. Рассчитайте совокупные вероятности

Вот совокупная вероятность («крайность») всех тестов Trainer Team. Мы визуализировали это для справки ниже:

Кумулятивные вероятности, подобные приведенной выше для командытренеров, аналогичным образом рассчитываются для каждой независимой переменной при постэволюционном движении.

Шаг 2: Рассчитайте p-значение распределения

Затем мы измеряем крайность указанного выше распределения по сравнению с равномерным распределением с помощью теста Андерсона-Дарлинга.

Предполагаемая переменная P-значение Андерсона-Дарлинга
Команда тренеров 0,4686

Значение p распределения в этом случае не ниже 0,005(что является требуемым значением p на уровне 95% после поправки на множественные сравнения) и, таким образом, не отличается от случайного (равномерного) распределения в любых значимых способ.

Точно так же ни одна из исследованных переменных не отличалась от однородного распределения таким образом. Следовательно, наши тесты не смогли обнаружить какой-либо значимой корреляции между исследованными факторами и постэволюционным набором движений.

Примечания

Примечание 1:

Тесты были сформулированы таким образом, чтобы гарантировать независимость каждого от других. Например, рассмотрим 45 ивисавров, из которых 15 изученных Sludge Bomb, 18 изученных Seed Bomb и 12 изученных Power Whip. Сначала мы проверим, являются ли 15 из 45 (pr = 1/3) значимыми для Sludge Bomb, а затем исключим Sludge Bomb Ivysaur из дальнейших тестов. Затем мы проверили бы 18 из 30 (pr = 1/2) на предмет «Семенная бомба». В принципе, был бы также тест на Power Whip, но поскольку он неинформативен (все 12 из оставшихся 12), он полностью игнорируется и не считается тестом. (Полиномиальное распределение не использовалось, поскольку поправка на дискретизацию, описанная в примечании 2, не так легко очевидна.)

Заметка 2:

Наша мера «экстремальности» строится из кумулятивной вероятности каждого теста посредством вычислений, связанных с p-значением наблюдения. Мы построили эту меру на основе p-значения, потому что для непрерывных распределений, когда нулевая гипотеза верна, мы знаем, что случайно выбранные p-значения распределены равномерно. (Значение p - это вероятность наблюдения образца, по крайней мере, такого же экстремального, как тот, который был виден.) Однако, поскольку биномиальное распределение является дискретным, биномиальная CDF (и любые p-значения) распределяются неравномерно, и конкретные производимые значения зависят от параметров бинома каждого отдельного теста (т. е. количества эволюций и вероятности каждого). Эта дискретизация вносит ложные отклонения,поэтому необходимо применить поправку, чтобы создать статистику, которая по-прежнему распределяется равномерно, когда нулевая гипотеза верна.

В качестве конкретного примера рассмотрим все перестановки пяти испытаний, дающие либо «А», либо «В», и мы наблюдаем два «А» из пяти. Каждая перестановка одинаково вероятна. При вычислении биномиального CDF ясно, что Pr (0 из 5) и Pr (1 из 5) являются «меньшим» успехом и, таким образом, включаются в накопление. Но затем существует большое количество равномерно вероятных перестановок, которые приводят к одному и тому же наблюдению два из пяти (т. Е. ABBAB - это то же самое, что и BAABB). Фактически, эти эквивалентные перестановки «связаны» друг с другом.

Хрестоматийное определение CDF является всеобъемлющим, то есть это вероятность достижения успеха, меньшая или равная определенному значению. Если бы мы использовали CDF наивно, наши значения всегда включали бы все «связанные» наблюдения, что эквивалентно постоянному изменению порядка перестановок так, чтобы наша наблюдаемая перестановка была «наибольшей» среди них. Следовательно, расчет становится слишком смещенным - это было бы хорошо для теста значимости (особенно при использовании больших размеров выборки), но не соответствует нашей текущей цели. Точно так же исключение ведет к низкому смещению. Выбор среднего значения между включающей и эксклюзивной версиями создает артефакты дискретизации при определенных общих значениях (например, 0,5). Ни один из них не подходит для нашего случая использования, когда мы знаем, что результирующее распределение должно быть равномерно случайным.

Одно из решений - выбрать равномерно случайное значение в диапазоне между исключительными и включающими значениями. Это примерно эквивалентно выполнению случайного разрыва связи среди кластера «связанных» перестановок и дает статистику с соответствующими свойствами. (Обратите внимание, что случайное изменение всегда меньше, чем изменение, которое было бы внесено путем вычитания одного «успешного» наблюдения из биномиального теста.) Это решение использовалось для построения гистограмм и выполнения тестов Андерсона-Дарлинга. Поскольку эта процедура является случайной, анализ был ограничен использованием конкретного состояния ГПСЧ по умолчанию. Мы также вручную проверили, что в целом наши результаты не различаются при использовании разных случайных чисел.

Заметка 3:

Хотя наш анализ показывает, что для переменных, которые мы учли, наборы перемещений назначаются случайным, единообразным назначением, остается возможность того, что могут существовать другие возможные переменные или несистемные факторы видов / перемещений (например, в случае хорошо известного Eevee Easeter egg при прозвище Райнер / Спарки / Поджигатель)

Примечание 4:

Тест разработан, чтобы проверить, соответствуют ли наши данные нулевой гипотезе. Это означает, что можно опровергнуть нулевую гипотезу, когда кажется, что данные получены из другого (не равномерного) распределения, но невозможно доказать, что нулевая гипотеза верна. Однако, используя смоделированные данные, мы считаем, что наш тест с таким размером выборки достаточно эффективен, чтобы обнаружить различия примерно в 5% или более в вероятностях присвоения каждому ходу.