data science

 0    19 Fiche    danielpruszynski
скачать mp3 басу ойын өзіңді тексер
 
сұрақ жауап
siatka algorytmu k sąsiadów
оқуды бастаңыз
k neighbors mesh
węzeł jest czysty, gdy wszystkie próbki w węźle należą do tej samej klasy
оқуды бастаңыз
the node is clean when all samples in the node belong to the same class
Pi k - współczynnik występowania klas k wśród próbek uczących w i-tym węźle
оқуды бастаңыз
Pi k - coefficient of occurrence of k classes among training samples in the i-th node
nadmierne dopasowanie
оқуды бастаңыз
overfitting
ostre granice modelu drzew decyzyjncyh, lasy losowe wygładzają te rożnice
оқуды бастаңыз
sharp boundaries of the decision tree model, random forests smooth out these corners
Wzajemna informacja (MI) między dwiema zmiennymi losowymi jest wartością nieujemną, która mierzy zależność między zmiennymi. Jest równy zero wtedy i tylko wtedy, gdy dwie zmienne losowe są niezależne, a wyższe wartości oznaczają większą zależność.
оқуды бастаңыз
Mutual information (MI) between two random variables is a non-negative value, which measures the dependency between the variables. It is equal to zero if and only if two random variables are independent, and higher values mean higher dependency.
maszyna wektorów nośnych (SVM)
оқуды бастаңыз
support vector machine (SVM)
macierz konfuzji
оқуды бастаңыз
confusion matrix
precyzja – odpowiada na pytanie, jaka proporcja pozytywnych identyfikacji była rzeczywiście poprawna.
оқуды бастаңыз
precision - answers the question what proportion of positive identifications was actually correct.
Przywołanie - odpowiedz na pytanie, jaki odsetek rzeczywistych pozytywów został zidentyfikowany poprawnie.
оқуды бастаңыз
Recall - answer the question what proportion of actual positives was identified correctly.
FPR, FNR
оқуды бастаңыз
FPR, FNR
False Positive Rate (FPR) - type I error. False Negative Rate (FNR) - type II error
f1 score - srednia harmoniczna precyzji i recall
оқуды бастаңыз
f1 score precision and recall harmonic mean
niedopasowanie modelu
оқуды бастаңыз
underfitting
danych nie da się oddzielić liniowo
оқуды бастаңыз
the data is not linearly separable
parkiet
оқуды бастаңыз
parquet
type of data
no sql - nie relacyjne
оқуды бастаңыз
no sql - non relational
the characteristic we can expect from a no sql database are that it is a non relational database as opposed to relational one
no sql rozpowszechnianie
оқуды бастаңыз
no sql distributed
distributed database that is designed to manage large scale data while maintaing a high performance
no sql - skalowalność
оқуды бастаңыз
no sql scalability
scalability throughput and availability
skalowalność przepustowości i dostepność
przekleństwo wymiarowości
оқуды бастаңыз
curse of dimensionality

Пікір қалдыру үшін жүйеге кіру керек.