Rijetki događaji u podatkovnim skupovima predstavljaju velik problem zbog velike zahtjevnosti njihove klasifikacije. Problem proizlazi iz neuravnoteženosti instanci normalnih i rijetkih događaja. Upravo zbog toga je potrebno promijeniti pristup izrade predikcijskog modela koji bi ih uspješno klasificirao. Ovakve situacije se često javljaju u područjima medicine i informacijske sigurnosti, sve do prijevara u kartičnom poslovanju, čijom problematikom se ovaj rad bavi. Za savladavanje neuravnoteženosti podataka koriste se metode poduzorkovanja i preuzorkovanja, a za izradu modela koriste se algoritmi logističke regresije, k-najbližih susjeda, slučajnih šuma i neuronskih mreža. Iz dobivenih rezultata vidljivo je da je metoda SMOTE preuzorkovanja povoljnija zato što, za razliku od poduzorkovanja, ne dolazi do gubitka informacija. Što se modela tiče, najbolji rezultati dobiveni su za algoritme k-najbližih susjeda i slučajnih šuma. No, kako je svaki bolji za određenu metriku, jedino krajnji korisnik može odlučiti o tome koji mu je prihvatljiviji, što je u ovom slučaju banka. Zbog velike širine područja klasifikacije, koristili su se jednostavni algoritmi strojnog učenja te su dobiveni rezultati, s tim na umu, zadovoljavajući. Rare events in data sets pose a major problem due to the high complexity of their classification. The problem stems from an imbalance of instances of normal and rare events. That is why it is necessary to change the approach to creating a prediction model that would successfully classify them. Such situations often occur in the fields of medicine and information security, all the way to fraud in the card business, the issues of which this paper deals with. Undersampling and oversampling methods are used to overcome data imbalances, and logistic regression algorithms, k-nearest neighbors, random forests, and neural networks are used to model. From the obtained results it is clear that the SMOTE method of oversampling is more favorable because, unlike undersampling, there is no loss of information. As for the model, the best results were obtained for the algorithms of k-nearest neighbors and random forests. But as each is better for a particular metric, only the end-user can decide which is more acceptable to him, which in this case is the bank. Due to the large breadth of the classification area, simple machine learning algorithms were used and the results obtained, with this in mind, were satisfactory.