Dersi geçmek için bilmen gereken her şey burada. Formüller, örnek sorular ve sınav odaklı notlar.
Ana kütle (Popülasyon) parametresini tahmin etmek için örneklem istatistiği etrafında oluşturulan aralıktır. Tek bir sayı yerine (Nokta tahmini), bir aralık vermek (Aralık tahmini) hata riskini yönetmemizi sağlar.
Örnek Olay: Cips Gramajı
Fabrikada 100 paket cips (n=100) tartılıyor. Ortalama 198 gr ($\bar{x}$) çıkıyor. Standart sapma 5 gr ($\sigma$). %95 güvenle gerçek ortalama nedir?
Z (0.05) için tablo değeri: 1.96
198 ± 1.96 * (5 / 10) = 198 ± 0.98
Sonuç: [197.02 ; 198.98]
Bir araştırmaya başlamadan önce sorulması gereken ilk soru: Kaç kişiyle görüşmeliyim?
Buradaki E (Error), kabul edebileceğimiz maksimum hata payıdır (Tolerans). Hata payını düşürmek istiyorsan, örneklem sayısını (n) karesi oranında artırmalısın.
İstatistik II dersinin en kritik konusudur. Bir iddiayı bilimsel olarak test etmek için kullanılır.
Statüko korunur. Fark yoktur, etki yoktur. ($\mu = 100$)
Araştırmacının iddiasıdır. Fark vardır, değişim vardır. ($\mu \neq 100$)
Elimizdeki ortalama, iddia edilen sayıya eşit mi?
İki farklı grubun ortalamalarını karşılaştırırız. Gruplar birbirinden bağımsızdır (Kadınlar vs Erkekler, A Şubesi vs B Şubesi).
Örnek Olay: Maaş Analizi
"Şirkette kadın çalışanların maaş ortalaması ile erkek çalışanların maaş ortalaması arasında istatistiksel olarak anlamlı bir fark var mı?" sorusu bu testle çözülür.
Burada iki farklı grup yoktur. AYNI GRUBUN iki farklı zamandaki ölçümü vardır.
Eğer karşılaştıracağımız grup sayısı 2'den fazlaysa (Örn: A, B ve C fabrikaları) ANOVA kullanırız.
Şu ana kadar hep sayısal verilerle (Maaş, Kilo, Yaş) çalıştık. Peki verilerimiz Sözel (Kategorik) ise ne yapacağız?
Bağımsızlık Testi: İki kategorik değişken arasında ilişki var mı?
Örnek: "Sigara içme durumu (İçiyor/İçmiyor)" ile "Akciğer kanseri olma durumu (Hasta/Sağlam)" arasında ilişki var mı?
İki değişken arasındaki ilişkinin Yönünü ve Gücünü ölçer. Korelasyon katsayısı (r) -1 ile +1 arasında değer alır.
Korelasyon bize ilişkiyi "gösterir", Regresyon ise ilişkiyi "formüle döker". Böylece Geleceğe Yönelik Tahmin yapabiliriz.
Y: Bağımlı Değişken (Sonuç), X: Bağımsız Değişken (Sebep)
Gerçek hayatta bir olayı tek bir sebeple açıklayamayız. Örneğin bir evin fiyatını sadece metrekaresi belirlemez; oda sayısı, konumu, bina yaşı da belirler.
$R^2$ (Belirlilik Katsayısı)
Modelimizin başarısını gösterir. $R^2 = 0.85$ ise, "Evin fiyatındaki değişimin %85'ini kurduğumuz bu model açıklayabiliyor" demektir.