Python

Задача на python Помогите пожалуйста

У вас сеть станций проката «Самокат подвезёт»: 20 точек в центре города, на каждой — максимум 50 электросамокатов. Вы хотите проверить гипотезу, что в прошлом месяце на любой станции днём было доступно в среднем 30 самокатов. Именно о таком количестве говорили урбанисты КБ «Белка» в исследовании мобильности горожан. Если самокатов на станции меньше, то пользователи думают, что не смогут арендовать самокат, когда он понадобится. А когда их больше, горожанам кажется, что оставить самокат на парковке не получится — не будет свободных мест.
Каждая станция ежечасно отсылала на сервер текущее количество самокатов. Вы загрузили значения с 13:00 до 16:00 за последние 30 дней. Проверьте гипотезу по этой выборке.

from scipy import stats as stimport pandas as pd
scooters = pd.Series([15, 31, 10, 21, 21, 32, 30, 25, 21,
28, 25, 32, 38, 18, 33, 24, 26, 40, 24, 37, 20, 36, 28, 38,24, 35, 33, 21, 29, 26, 13, 25, 34, 38, 23, 37, 31, 28, 32,
24, 25, 13, 38, 34, 48, 19, 20, 22, 38, 28, 31, 18, 21, 24,31, 21, 28, 29, 33, 40, 26, 33, 33, 6, 27, 24, 17, 28, 7,
33, 25, 25, 29, 19, 30, 29, 22, 15, 28, 36, 25, 36, 25, 29,33, 19, 32, 32, 28, 26, 18, 48, 15, 27, 27, 27, 0, 28, 39,
27, 25, 39, 28, 22, 33, 30, 35, 19, 20, 18, 31, 44, 20, 18,17, 28, 17, 44, 40, 33,])
optimal_value = # введите ваш код тут
alpha = # введите ваш код тут
results = # введите ваш код тут
print('p-значение:', # введите ваш код тут)
if # введите ваш код тут:
print("Отвергаем нулевую гипотезу")else:
print("Не получилось отвергнуть нулевую гипотезу")
Для проверки гипотезы о среднем количестве самокатов на станции в прошлом месяце можно использовать одновыборочный t-тест.

Вот код, который вы можете использовать:
 from scipy import stats as st 
import pandas as pd

scooters = pd.Series([15, 31, 10, 21, 21, 32, 30, 25, 21,
28, 25, 32, 38, 18, 33, 24, 26, 40, 24, 37,
20, 36, 28, 38, 24, 35, 33, 21, 29, 26, 13,
25, 34, 38, 23, 37, 31, 28, 32, 24, 25, 13,
38, 34, 48, 19, 20, 22, 38, 28, 31, 18, 21,
24, 31, 21, 28, 29, 33, 40, 26, 33, 33, 6,
27, 24, 17, 28, 7, 33, 25, 25, 29, 19, 30,
29, 22, 15, 28, 36, 25, 36, 25, 29, 33, 19,
32, 32, 28, 26, 18, 48, 15, 27, 27, 27, 0,
28, 39, 27, 25, 39, 28, 22, 33, 30, 35, 19,
20, 18, 31, 44, 20, 18, 17, 28, 17, 44, 40,
33])

optimal_value = 30
alpha = 0.05

t_statistic, p_value = st.ttest_1samp(scooters, optimal_value)

print('p-значение:', p_value)

if p_value < alpha:
print("Отвергаем нулевую гипотезу")
else:
print("Не получилось отвергнуть нулевую гипотезу")
Здесь мы задали оптимальное значение (30), уровень значимости (alpha) и использовали функцию ttest_1samp из библиотеки SciPy для вычисления t-статистики и соответствующего p-значения. Затем мы сравнили полученное p-значение с уровнем значимости alpha и вывели результат теста. Если p-значение меньше уровня значимости, то мы отвергаем нулевую гипотезу о том, что среднее количество самокатов на станции равно 30. В противном случае мы не можем отвергнуть эту гипотезу.
AK
Akyl Kusenov
1 068
Лучший ответ
 optimal_value = 30 
alpha = 0.05
results = st.ttest_1samp(scooters, optimal_value)
print('p-значение:', results[1])
if results[1] < alpha:
print("Отвергаем нулевую гипотезу")
else:
print("Не получилось отвергнуть нулевую гипотезу")
DB
Darhan Baitenov
22 178
Для проверки данной гипотезы можно воспользоваться t-тестом.

В первую очередь, необходимо импортировать библиотеки numpy и scipy для работы с данными и проведения t-теста:
 import numpy as np 
from scipy.stats import ttest_1samp
Затем, создадим список scooters, в котором будут храниться данные о количестве самокатов на каждой станции за каждый час в течение 30 дней:
 scooters = [ 
[43, 46, 42, 39], # данные по первой станции
[30, 28, 32, 26], # данные по второй станции
... # данные по остальным станциям
[47, 48, 49, 45] # данные по последней станции
]
Далее, посчитаем среднее значение количества самокатов на каждой станции за каждый час:
 mean_scooters = np.mean(scooters, axis=1)  
Затем, проведем t-тест для проверки гипотезы о среднем количестве самокатов на станции, используя уровень значимости 0.05:
 t_statistic, p_value = ttest_1samp(mean_scooters, 30) 
if p_value < 0.05:
print("Гипотеза о среднем количестве самокатов на станции не подтвердилась.")
else:
print("Гипотеза о среднем количестве самокатов на станции подтвердилась.")
Если значение p_value меньше 0.05, то гипотеза о среднем количестве самокатов на станции не подтвердилась, что означает, что в прошлом месяце на любой станции днём было доступно в среднем не 30 самокатов, как говорили урбанисты КБ «Белка» в исследовании мобильности горожан, а другое значение. Если же значение p_value больше 0.05, то гипотеза подтвердилась и на станциях действительно в прошлом месяце днём было доступно в среднем 30 самокатов.
***кролик *** Спасибо большое, по условиям
optimal_value = # введите ваш код тут
alpha = # введите ваш код тут
results = # введите ваш код тут