Δεδομένα: ιστορικά στοιχεία για 20 πελάτες: οικογενειακό εισόδημα σε ευρώ (μεταβλητή income), μέγεθος του χρέους ως ποσοστό του οικογενειακού εισοδήματος (μεταβλητή deptinc) και το γεγονός της αδυναμίας αποπληρωμής (μεταβλητή default).

# data records for 20 customers: Family income (income), dept as percent of family income (deptinc) and  failure to pay (default).
income = c(31, 55, 120, 25, 38, 16, 23, 64, 29, 100, 72, 61, 26, 176, 49, 25, 67, 28, 19, 41)
debtinc = c(17, 6, 3, 10, 4, 2, 5, 10, 16, 9, 8, 6, 2, 9, 9, 20, 31, 17, 24, 16)
default = c(1, 0,0,0,1,1,0,0,1,0,0,0,0,0,0,1,1,1,1,1)
default = factor(default, levels = c(0, 1), labels = c("Κανονική αποπληρωμή", "Αδυναμία αποπληρωμής"))
lr.data.frame = data.frame(income, debtinc, default)


1. Υπολογισμός του συντελεστή συσχέτισης του Pearson.

cor.test(income, debtinc)


2. Λογιστικό μοντέλο (Logistic regression model)

fit = glm(default ~ income + debtinc,data=lr.data.frame,family=binomial())
summary(fit)


3. Αποτελεσματικότητα της εξίσωσης πρόβλεψης

theProbs = fitted(fit)
table(theProbs>0.5, lr.data.frame$default)


4. Συντελεστής Nagelkerke R2 (Pseudo square)

library(rms)
model1 = lrm(default ~ income + debtinc, data = lr.data.frame)
print(model1)


5. Εκθετικοί συντελεστές και 95% διάστημα εμπιστοσύνης

exp(coef(fit)) 
exp(confint(fit))