Sabtu, 23 September 2017

Pengantar pola penambangan yang sering

Solusi sains dan teknologi -- Dalam posting blog ini, saya akan memberikan gambaran singkat tentang subfield penting yang disebut.Pertambangan pola terdiri dari penggunaanjuga bisa diterapkan di beberapa aplikasi lainnya.Transaksi didefinisikan satu set item yang berbeda (simbol).mengambil sebagai masukan (1) ambang batas yang ditetapkan oleh pengguna dan (2) database transaksi yang berisi satu set transaksi.

Solusi sains dan teknologi -- Keluarkan semuanya, yaitu kelompok item yang dibagikan tidak kurang dari transaksi di basis data masukan.Misalnya, perhatikan database transaksi berikut yang berisi empat transaksi.Mengingat satu dari dua transaksi, frequent itemset adalah "roti, mentega", "susu roti", "roti", "susu" dan "mentega" .T1: roti, mentega, bayam T2: mentega, salmon T3: roti, susu, mentega T4: sereal, roti milka database transaksiApriori juga dapat menerapkan langkah pasca-pengolahan untuk menghasilkan "peraturan asosiasi" dari frequent itemset, yang tidak akan saya bahas di sini.Telah melahirkan beberapa algoritma yang membahas masalah atau variasi yang sama dari ini.

Solusi sains dan teknologi -- masalah seperti (1) secara bertahap menemukan frequent itemsets dan asosiasi, (2) menemukan subgraf yang sering dari satu set grafik, (3) sampaitemukan subsequences yang umum pada beberapa urutan, dll.Contoh kedua yang akan saya berikan adalah di a.Database urutan didefinisikan sebagai sekumpulan urutan.Urutan adalah daftar transaksi (seperti yang didefinisikan sebelumnya).

Solusi sains dan teknologi -- Misalnya di bagian kiri dari gambar berikut database urutan yang berisi empat urutan ditampilkan.Urutan pertama berisi item dan diikuti oleh, diikuti oleh, diikuti oleh, diikuti oleh.A memiliki bentuk X -> Y dimana X dan Y adalah dua rangkaian item kosong yang tidak kosong.Arti sebuah aturan adalah bahwa jika item X muncul secara berurutan dalam urutan apapun, item tersebut akan diikuti oleh item Y dalam urutan apapun.

Solusi sains dan teknologi -- Jumlah urutan yang berisi aturan dibagi dengan jumlah total urutan.Jumlah urutan yang mengandung aturan dibagi dengan jumlah urutan yang mengandung antesedennya.Tujuannya adalah untuk menemukan semua yang memiliki dukungan dan kepercayaan tidak kurang dari dua ambang batas yang diberikan oleh pengguna yang bernama "minsup" dan "minconf".Sebagai contoh,Pada bagian kanan dari gambar berikut, beberapa aturan sekuensial ditunjukkan dan ditemukan oleh .Untuk rincian lebih lanjut tentang penambangan aturan sekuensial, makalah ini menyajikan algoritma RuleGrowth (saya adalah penulis makalah itu).

Solusi sains dan teknologi -- Penambangan di lapangan sering dipandang sebagai teknik untuk menjelaskan masa lalu dengan menemukan pola.Namun, pola yang ditemukan juga bisa digunakan untuk prediksi.Sebagai contoh aplikasi, makalah berikut menunjukkan bagaimana aturan sekuensial dapat digunakan untuk memprediksi halaman web berikutnya yang akan dikunjungi oleh pengguna di situs web, dengan akurasi yang lebih tinggi daripada menggunakan (diberi nama "aturan sekuensial klasik" di kertas itu): Fournier -Viger, P.Gueniche, T., Tseng, VS (2012).

Solusi sains dan teknologi -- .Proc.Konferensi Internasional ke-8 tentang Pertambangan dan Aplikasi Data Lanjutan (ADMA 2012), Springer LNAI 7713, hlm.431-442.Jika Anda ingin mengetahui lebih banyak informasi tentang penambangan pola, sebagian besar buku data mining umum seperti buku Han & Kamber dan Tan, Steinbach & Kumar memiliki setidaknya satu bab yang ditujukan untuk pola mining.Jika Anda ingin menguji algoritma penambangan pola, saya sarankan untuk melihat (saya adalah pendiri proyek), yang menawarkan kode sumber Java lebih dari 55 algoritma pola penambangan, dengan contoh sederhana, dan perintah sederhana.

Solusi sains dan teknologi -- line dan antarmuka pengguna grafis untuk pengujian algoritma dengan cepat.Penambangan otomatis adalah subfield data mining yang telah aktif selama lebih dari 20 tahun, dan masih sangat aktif.Pola algoritma pertambangan memiliki berbagai macam aplikasi.Sebagai contoh, algoritma Apriori juga dapat diterapkan pada indeks bitmap data wharehouse yang optimal.

Solusi sains dan teknologi -- Dalam posting blog ini, saya telah memberikan dua contoh untuk memberi gambaran kasar tentang apa tujuan dari pola penambangan.Namun, perhatikan bahwa tidak mungkin meringkas dua puluh tahun penelitian dalam satu entri blog.Jika Anda ingin terus membaca topik ini, Anda dapat membaca tulisan saya dan saya, yang memberi pengantar yang bagus tentang topik menemukan pola yang sering terjadi di urutan (pola sekuensial) dan database transaksibahwa posting ini sangat menarik.Jika Anda menyukai blog ini, Anda dapat berlangganan ke akun RSS Feed atau Twitter saya (https: .

Solusi sains dan teknologi --

Tidak ada komentar:

Posting Komentar