Задана зависимость между выработкой продукции на одного работника и удельного веса рабочих высокой квалификации: Х 32 30 36 40 41 47 ...
Условие:
Решение:
Для нахождения уравнения парной регрессии между переменными X (выработка продукции на одного работника) и Y (удельный вес рабочих высокой квалификации), мы можем использовать метод наименьших квадратов.
Сначала построим уравнение парной регрессии для X от Y:
-
Вычислим средние значения X и Y: Среднее значение X (X̄) = (32 + 30 + 36 + 40 + 41 + 47 + 56 + 54) / 8 = 42.25 Среднее значение Y (Ȳ) = (20 + 26 + 28 + 30 + 31 + 33 + 34 + 37) / 8 = 30.375
-
Вычислим сумму произведений отклонений X и Y от их средних значений: Σ((X - X̄) * (Y - Ȳ)) = (32 - 42.25) * (20 - 30.375) + (30 - 42.25) * (26 - 30.375) + ... + (54 - 42.25) * (37 - 30.375) = -169.625
-
Вычислим сумму квадратов отклонений X от его среднего значения: Σ((X - X̄)^2) = (32 - 42.25)^2 + (30 - 42.25)^2 + ... + (54 - 42.25)^2 = 540.75
-
Вычислим коэффициент регрессии b: b = Σ((X - X̄) * (Y - Ȳ)) / Σ((X - X̄)^2) = -169.625 / 540.75 ≈ -0.3137
-
Вычислим коэффициент сдвига a: a = Ȳ - b * X̄ = 30.375 - (-0.3137) * 42.25 ≈ 43.53
Таким образом, уравнение парной регрессии для X от Y будет выглядеть следующим образом: X = 43.53 - 0.3137Y
Теперь построим уравнение парной регрессии для Y от X:
-
Вычислим сумму произведений отклонений X и Y от их средних значений (так как эти значения уже были вычислены): Σ((X - X̄) * (Y - Ȳ)) = -169.625
-
Вычислим сумму квадратов отклонений Y от его среднего значения: Σ((Y - Ȳ)^2) = (20 - 30.375)^2 + (26 - 30.375)^2 + ... + (37 - 30.375)^2 = 155.875
-
Вычислим коэффициент регрессии b': b' = Σ((X - X̄) * (Y - Ȳ)) / Σ((Y - Ȳ)^2) = -169.625 / 155.875 ≈ -1.088
-
Вычислим коэффициент сдвига a': a' = Ȳ - b' * X̄ = 30.375 - (-1.088) * 42.25 ≈ 75.24
Таким образом, уравнение парной регрессии для Y от X будет выглядеть следующим образом: Y = 75.24 - 1.088X
Теперь оценим тесноту и направление связи с помощью коэффициента корреляции. Для этого воспользуемся формулой:
r = Σ((X - X̄) * (Y - Ȳ)) / sqrt(Σ((X - X̄)^2) * Σ((Y - Ȳ)^2))
Вычислим числитель: Σ((X - X̄) * (Y - Ȳ)) = -169.625
Вычислим знаменатель: sqrt(Σ((X - X̄)^2) * Σ((Y - Ȳ)^2)) = sqrt(540.75 * 155.875) ≈ 198.96
Теперь вычислим коэффициент корреляции: r = -169.625 / 198.96 ≈ -0.853
Коэффициент корреляции r равен примерно -0.853. Он отрицательный, что указывает на обратную связь между переменными X и Y. Значение близко к -1, что говорит о сильной обратной связи между этими переменными.
Чтобы проверить значимость коэффициента корреляции, мы можем использовать t-статистику и проверить его против альтернативной гипотезы о том, что коэффициент корреляции равен нулю.
Для этого нам понадобится также вычислить стандартную ошибку коэффициента корреляции:
SE(r) = sqrt((1 - r^2) / (n - 2))
где n - количество наблюдений (в данном случае 8).
Вычислим стандартную ошибку: SE(r) = sqrt((1 - (-0.853)^2) / (8 - 2)) ≈ 0.176
Теперь вычислим t-статистику: t = r / SE(r) = -0.853 / 0.176 ≈ -4.843
Для уровня значимости α = 0.05 и степеней свободы df = n - 2 = 6, критическое значение t составляет примерно ±2.447.
Так как |t| > 2.447, мы отвергаем нулевую гипотезу о том, что коэффициент корреляции равен нулю. Это означает, что коэффициент корреляции является значимым.
Выводы:
- Между выработкой продукции на одного работника и удельным весом рабочих высокой квалификации существует обратная связь.
- Уравнение парной регрессии для X от Y: X = 43.53 - 0.3137Y.
- Уравнение парной регрессии для Y от X: Y = 75.24 - 1.088X.
- Коэффициент корреляции r равен примерно -0.853, что указывает на сильную обратную связь между переменными.
- Коэффициент корреляции является значимым, что подтверждается t-статистикой.