In [1]:
import pandas as pd
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn import preprocessing
import sklearn.metrics as met


In [3]:
#ucitavanje i podela na opis instanci i klase
df = pd.read_csv("C:/Users/student/Desktop/ipIndustija4/ipVezbe92021/vezbe9/iris.csv")

features = df.columns[:4].tolist()

x=df[features]
x.columns = features
y=df["Species"]


In [6]:
x_train, x_test, y_train, y_test = train_test_split(x, y, train_size=0.7, stratify=y)


In [20]:
scaler = preprocessing.MinMaxScaler().fit(x_train)
x_train =pd.DataFrame(scaler.transform(x_train))
x_train.columns = features

x_test =pd.DataFrame(scaler.transform(x_test))
x_test.columns = features

In [21]:
"""
hidden_layer_sizes - brojevi neurona u skrivenim slojevima
 default=100

activation - aktivaciona fja
 identity f(x) = x
 logistic sigmoidna fja f(x) = 1 / (1 + exp(-x))
 tanh tangens hiperbolicki f(x) = tanh(x)
 relu f(x) = max(0, x)

solver - resavac za optimizaciju tezina
 sgd stohastickog opadajuceg gradijenta

batch_size - velicina serija: broj instanci u jednom koraku za racunanje gradijenta
 default = 200

learning_rate - stopa ucenja pri azuriranju tezina
 constant konstantna, zadata sa learning_rate_init
 invscaling postepeno smanjenje stope ucenja u koraku t, effective_learning_rate = learning_rate_init / pow(t, power_t)
 adaptive stopa ucenja se ne menja dok se vrednost fje gubitka smanjuje.
 Kad se u dva uzastopna koraka gubitak ne smanji za bar vrednost tol,
 ili se precisnost nad skupom za validaciju (ako je zadato da postoji takav skup)
 za bar vrednost tol, stopa ucenja se seli sa

learning_rate_init - inicijalna stopa ucenja
 default=0.001
power_t
 default=0.5

max_iter - maksimalan broj iteracija
 default=200

tol - tolerancija optimizacije za gubitak ili preciznost
 default = 1e-4

shuffle - da li izvrsiti mesanje instanci za svaku iteraciju
 default=False

verbose - da li ispisati poruke o progresu na standardni izlaz

early_stopping - da li izvrsiti rano zaustavljanje kada se preciznost nad skupom za validaciju
 ne povecava, za validaciju se onda uzima 10% trening skupa
 default=False

validation_fraction - koji deo skupa za treniranje se koristi za validaciju
 Primenjivo ako je early_stopping=True
 default=0.1
"""

params = [{'solver':['sgd'],
 'learning_rate':['constant', 'invscaling', 'adaptive'],
 'learning_rate_init':[0.01, 0.005, 0.002],
 'activation' : ['identity', 'logistic', 'tanh', 'relu' ],
 'hidden_layer_sizes' : [(10,3), (10,10), (50,50)],
 'max_iter': [500]

 }]


In [28]:
clf = GridSearchCV(MLPClassifier(), params, cv=5)
clf.fit(x_train, y_train)


In [23]:
print("Najbolji parametri:")
print(clf.best_params_)


Najbolji parametri:
{'activation': 'tanh', 'hidden_layer_sizes': (10, 3), 'learning_rate': 'adaptive', 'learning_rate_init': 0.005, 'max_iter': 500, 'solver': 'sgd'}


In [29]:
print("Ocena uspeha po klasifikatorima:")
means = clf.cv_results_['mean_test_score']
stds = clf.cv_results_['std_test_score']
for mean, std, params in zip(means, stds, clf.cv_results_['params']):
 print("%0.3f (+/-%0.03f) za %s" % (mean, std * 2, params))


In [25]:
class_report = met.classification_report(y_train,clf.predict(x_train), target_names=clf.classes_)
print("Izvestaj klasifikacije", class_report, sep="\n")


Izvestaj klasifikacije
 precision recall f1-score support

 setosa 1.00 1.00 1.00 35
 versicolor 1.00 0.91 0.96 35
 virginica 0.92 1.00 0.96 35

 accuracy 0.97 105
 macro avg 0.97 0.97 0.97 105
weighted avg 0.97 0.97 0.97 105



In [26]:
print("Izvestaj za test skup:")
y_true, y_pred = y_test, clf.predict(x_test)
cnf_matrix = pd.DataFrame(met.confusion_matrix(y_test, y_pred), 
 index=clf.classes_, columns=clf.classes_)
print("Matrica konfuzije", cnf_matrix, sep="\n")

accuracy = met.accuracy_score(y_test, y_pred)
print("Preciznost", accuracy)

class_report = met.classification_report(y_test, y_pred, target_names=clf.classes_)
print("Izvestaj klasifikacije", class_report, sep="\n")


Izvestaj za test skup:
Matrica konfuzije
 setosa versicolor virginica
setosa 15 0 0
versicolor 0 14 1
virginica 0 1 14
Preciznost 0.9555555555555556
Izvestaj klasifikacije
 precision recall f1-score support

 setosa 1.00 1.00 1.00 15
 versicolor 0.93 0.93 0.93 15
 virginica 0.93 0.93 0.93 15

 accuracy 0.96 45
 macro avg 0.96 0.96 0.96 45
weighted avg 0.96 0.96 0.96 45



In [27]:
print('Broj iteracija: ', clf.best_estimator_.n_iter_)
print('Broj slojeva: ', clf.best_estimator_.n_layers_)
print('Koeficijenti:', clf.best_estimator_.coefs_, sep='\n')
print('Bias:', clf.best_estimator_.intercepts_, sep='\n')


Broj iteracija: 500
Broj slojeva: 4
Koeficijenti:
[array([[ 0.09609942, -0.12107981, 0.52610371, -0.10938628, -0.16833315,
 -0.42834138, 0.17156497, 0.04643681, 0.22878301, -0.06538772],
 [ 0.69561624, -0.49214875, 0.15457957, 0.0236978 , -0.59198475,
 -0.27723742, -0.56185542, 0.75560583, 0.48884849, -0.90377294],
 [ 0.07851986, 0.44308248, 0.53631944, -0.75359555, 0.03385684,
 0.04014964, -0.33472234, -0.41884165, -0.03386422, 1.05764312],
 [ 0.11417256, -0.10446146, 0.27688751, -0.29819946, 0.54929703,
 1.24175719, 0.04239881, -1.12974437, -0.39983181, 0.97105697]]), array([[ 0.2075621 , 0.31920742, 0.32525437],
 [-0.0596762 , -0.52400645, 0.18480043],
 [-0.50914915, 0.3451839 , 0.96860342],
 [ 0.66393844, 0.55856935, -0.28125955],
 [-0.70175595, 0.18274997, -0.25434607],
 [-0.58552113, 0.2588536 , 1.03944674],
 [-0.43725795, 0.29142633, 0.03932311],
 [ 1.03917037, -0.14936963, -1.13931136],
 [-0.25450928, 0.44221902, -0.12070449],
 [-1.29443488, -0.33781047, 1.47022426]]), array([[