Articles

COVERAGE, DIVERSITY, AND COHERENCE OPTIMIZATION FOR MULTI-DOCUMENT SUMMARIZATION Umam, Khoirul; Putro, Fidi Wincoko; Pratamasunu, Gulpi Qorik Oktagalu; Arifin, Agus Zainal; Purwitasari, Diana
Jurnal Ilmu Komputer dan Informasi Vol 8, No 1 (2015): Jurnal Ilmu Komputer dan Informasi (Journal of Computer Science and Information)
Publisher : Faculty of Computer Science - Universitas Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (608.144 KB) | DOI: 10.21609/jiki.v8i1.278

Abstract

A great summarization on multi-document with similar topics can help users to get useful in for ma tion. A good summary must have an extensive coverage, minimum redundancy (high diversity), and smooth connection among sentences (high coherence). Therefore, multi-document summarization that con siders the coverage, diversity, and coherence of summary is needed. In this paper we pro pose a novel method on multi-document summarization that optimizes the coverage, diversity, and co her ence among the summary's sentences simultaneously. It integrates self-adaptive differential evo lu tion (SaDE) al gorithm to solve the optimization problem. Sentences ordering algorithm based on top ic al closeness ap proach is performed in SaDE iterations to improve coherences among the summary's sen tences. Ex pe ri ments have been performed on Text Analysis Conference (TAC) 2008 data sets. The ex perimental re sults showed that the proposed method generates summaries with average coherence and ROUGE scores 29-41.2 times and 46.97-64.71% better than any other method that only consider coverage and di versity, re-spect ive ly.
IMPLEMENTASI PURWARUPA WEB PORTAL BERBASIS ONTOLOGI UNTUK KOLABORASI MATERI DARI BEBERAPA SISTEM MOODLE Yuhana, Umi Laili; Hidayah, Lailatul; Purwitasari, Diana
Semantik Vol 1, No 1 (2011): Prosiding Semantik 2011
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (490.858 KB)

Abstract

Pemanfaatan teknologi untuk kepentingan pendidikan bukan merupakan isu baru. Salah satunya yaitu Learning Management System(LMS). LMS ini telah banyak diterapkan di Indonesia. Selain sebagai manajemen perkuliahan, forum pengajar dan pelajar, LMS juga digunakan sebagai sumber referensi materi pembelajaran. Berbagai fasilitas dan kemudahan ditawarkan oleh LMS. Moodle, sebagai salah satu jenis LMS mempunyai penyimpanan materi kuliah yang dapat ditemukan oleh mesin pencari seperti Google. Hasil pencarian seringkali tidak dapat dibuka karena keterbatasan hak akses, hanya penggunayang terdaftar yang dapat membuka berkas yang diunggah dalam LMS perguruan tinggi. Pencarian yang ada di suatu LMS hanya dapat digunakan untuk menemukan koleksi materi yang ada di LMS tersebut, koleksi yang ada di LMS lain tersimpan secara terpisah dan dapat ditemukan di LMS yang lain. Untukmembaca materi yang ada di beberapa situs LMS, pengguna harus membuka semua situs LMS yang dimaksud. Melalui makalah ini, penulis memaparkan proses pembuatan aplikasi berbasis web yang dapat menyajikan materi dari beberapa sistem berbasis Moodle dengan bantuan web service. Dengan sistem ini, pengguna cukup mengunjungi satu situs ini untuk dapat mengakses materi-materi dalam beberapa situselearning. Materi tersebut dikelompokkan berdasarkan standar klasifikasi tertentu agar memberi kemudahan kepadapengguna dalam pencarian. Sistem kolaborasi memanfaatkan plug-in web service dari Moodle yaitu OKTech Web Service Untuk uji coba digunakan standar klasifikasi dalam domain rekayasa perangkat lunak yaitu Software Engineering Body of Knowledge (SWEBOK). Mesin pencariannya dirancang dengan model sistem pencarian berbasis konteks dengan bantuan ontologi. Uji coba dilakukan dengan tiga server e-learning berbasis Moodle di lingkungan intranet Teknik Informatika, Institut Teknologi Sepuluh Nopember. Sistem yang diberi nama eduPortal ini telah dapat mengambil data dari beberapa e-learning dengan menggunakan teknologi web service sehingga dengan sistem ini seorang pengguna akan dapat melihat materi dari beberapa e-learning. Dengan ontologi, aplikasi ini terbukti dapat memodelkan manajemen dokumen sesuai dengan SWEBOK dan mewujudkan sistem pencarian berbasis konteks.Kata kunci: Kolaborasi Moodle, Web Semantik, SWEBOK
PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS Purwitasari, Diana
Semantik Vol 1, No 1 (2011): Prosiding Semantik 2011
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (599.112 KB)

Abstract

Jaringan  saraf  tiruan  (JST)  adalah  jaringan  yang  cara kerjanya  meniru  jaringan  saraf  manusia  ditandai dengan sebuah  set  masukan  dan  sebuah  set  keluaran.  Proses pembelajaran  dalam  jaringan  akan mengekstraksi informasi  dari  berbagai  macam  input  yang  diberikan. Diantara  masukan  dan  keluaran terdapat  layer  untuk memproses  input  yang  dinamakan unit  tersembunyi (hidden  layer).  Salah  satu  model JST  adalah  jaringan saraf  fungsi  radial  basis  (Radial  Basis  Function  Neural Network  =  RBFNN)  yaitu model jaringan saraf dengan satu unit dalam lapisan tersembunyi. Jumlah layer tunggal pada hidden layer menyebabkan  permasalahan  pembelajaran  di RBFNN  dapat  dianggap  sebagai  suatu  sistem  linear. Pada RBFNN  fungsi  aktivasi  yang  digunakan  adalah  fungsi basis  (Gaussian)  dengan  fungsi  linear  di  lapisan output. Dikarenakan  RBFNN  adalah  sistem  linear  sehingga  teknik Orthogonal  Least  Squares  (OLS)  yang menerapkan konsep  basis  orthogonal  dengan  pendekatan  terdekat  ke  solusi sebenarnya  dapat  menjadi salah satu algoritmapembelajaran pada RBFNN. Makalah ini membahas pembelajaran bertingkat sebagai cara  optimasi pembelajaran  pada  RBFNN  yang  menggabungkan  teknik  linear  yaitu Regularized Orthogonal  Least  Sqaures  (ROLS)  dan  non linear  yaitu  algoritma  genetik.  Hasil  ujicoba menunjukkan untuk  semua  data  dengan  persentase pembelajaran  dan  parameter  algoritma  genetik  yang berbeda-beda mempunyai akurasi yang bervariasi pula. Akan tetapi rata-rata hasil ujicoba menghasilkan akurasi di atas 90% dan bahkan untuk beberapa percobaan akurasi bisa mencapai 100%
PEMBELAJARAN BERTINGKAT PADA ARSITEKTUR JARINGAN SARAF FUNGSI RADIAL BASIS Purwitasari, Diana; Pusposari, Glory Intani; Sulaiman, Rully
Semantik Vol 1, No 1 (2011): Prosiding Semantik 2011
Publisher : Semantik

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (599.112 KB)

Abstract

Jaringan saraf tiruan (JST) adalah jaringan yang cara kerjanya meniru jaringan saraf manusia ditandai dengan sebuah set masukan dan sebuah set keluaran. Proses pembelajaran dalam jaringan akan mengekstraksi informasi dari berbagai macam input yang diberikan. Diantara masukan dan keluaran terdapat layer untuk memproses input yang dinamakan unit tersembunyi (hidden layer). Salah satu model JST adalah jaringan saraf fungsi radial basis (Radial Basis Function Neural Network = RBFNN) yaitu model jaringan saraf dengan satu unit dalam lapisan tersembunyi. Jumlah layer tunggal pada hidden layermenyebabkan permasalahan pembelajaran di RBFNN dapat dianggap sebagai suatu sistem linear. Pada RBFNN fungsi aktivasi yang digunakan adalah fungsi basis (Gaussian) dengan fungsi linear di lapisan output. Dikarenakan RBFNN adalah sistem linear sehingga teknik Orthogonal Least Squares (OLS) yang menerapkan konsep basis orthogonal dengan pendekatan terdekat ke solusi sebenarnya dapat menjadi salah satu algoritma pembelajaran pada RBFNN. Makalah ini membahas pembelajaran bertingkat sebagai cara optimasi pembelajaran pada RBFNN yang menggabungkan teknik linear yaitu Regularized Orthogonal Least Sqaures (ROLS) dan non linear yaitu algoritma genetik. Hasil ujicoba menunjukkan untuk semua data dengan persentase pembelajaran dan parameter algoritma genetik yang berbeda-beda mempunyai akurasi yang bervariasi pula. Akan tetapi rata-rata hasil ujicoba menghasilkan akurasi diatas 90% dan bahkan untuk beberapa percobaan akurasi bisa mencapai 100%.Kata kunci : jaringan saraf fungsi radial basis, optimasi pembelajaran, regularized orthogonal least sqaures,algoritma genetik
A STUDY ON RANKING METHOD IN RETRIEVING WEB PAGES BASED ON CONTENT AND LINK ANALYSIS: COMBINATION OF FOURIER DOMAIN SCORING AND PAGERANK SCORING Purwitasari, Diana
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 7, No 1, Januari 2008
Publisher : Informatics, ITS

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (2047.368 KB) | DOI: 10.12962/j24068535.v7i1.a57

Abstract

Ranking module is an important component of search process which sorts through relevant pages. Since collection of Web pages has additional information inherent in the hyperlink structure of the Web, it can be represented as link score and then combined with the usual information retrieval techniques of content score. In this paper we report our studies about ranking score of Web pages combined from link analysis, PageRank Scoring, and content analysis, Fourier Domain Scoring. Our experiments use collection of Web pages relate to Statistic subject from Wikipedia with objectives to check correctness and performance evaluation of combination ranking method. Evaluation of PageRank Scoring show that the highest score does not always relate to Statistic. Since the links within Wikipedia articles exists so that users are always one click away from more information on any point that has a link attached, it it possible that unrelated topics to Statistic are most likely frequently mentioned in the collection. While the combination method show link score which is given proportional weight to content score of Web pages does effect the retrieval results.
RANCANG BANGUN APLIKASI PENGAMBILAN BERITA SECARA OTOMATIS MENGGUNAKAN CONTENT SYNDICATION BERBASIS XML DENGAN PLATFORM MICROSOFT .NET Purwitasari, Diana; Samopa, Febriliyan; Afrian, Ade
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 3, No 1 Januari 2004
Publisher : Informatics, ITS

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (207.357 KB) | DOI: 10.12962/j24068535.v3i1.a128

Abstract

Banyaknya kebutuhan akan informasi di internet menyebabkan penyedia jasa situs berita untuk memberikan berita yang selalu yang terbaru. Salah satu alternatif solusi adalah dengan melakukan content syndication. Content syndication adalah adalah proses dimana suatu isi berita dikirimkan atau disediakan, biasanya dengan biaya tertentu, dari penyedia berita, biasanya disebut originators, ke pasar yang membutuhkan atau subscribers. RSS (Rich Site Summary) adalah format yang secara umum digunakan untuk melakukannya. RSS pada dasarnya adalah suatu file yang berada di suatu situs, yang menyediakan informasi tentang isi dari situs tersebut. File tersebut biasa disebut sebagai RSS Feeds dan dapat di ambil dan diolah untuk mendapatkan informasi tentang isi situs tersebut. Dibuat sebuah aplikasi untuk pengambilan situs berita secara otomatis menggunakan content syndication yang memerlukan aplikasi pada proses background untuk mengambil RSS Feeds secara berkala pada komputer yang berfungsi sebagai server. Server yang mengambil berita dari situs penyedia terdiri dari aplikasi yang mengatur konfigurasi berita tersebut, dan sebuah windows service untuk mengambil RSS feeds kemudian mengolahnya secara otomatis. Sedangkan aplikasi untuk membaca berita dari RSS server terdapat pada client berupa sebuah komponen plug-in. Uji coba pertama dilakukan dengan menguji keberhasilan aplikasi dalam mengatur konfigurasi skema, atribut tabel, dan pengaturan kategori situs penyedia RSS. Sedangkan ujicoba kedua dilakukan dengan melakukan perbandingan hasil pencarian berita yang didapat dari program dengan berita dari situs lain yang tidak menerapkan content syndication. Dari hasil pengujian diketahui bahwa aplikasi dengan content syndication mampu melakukan pencarian berita dan memberikan hasil yang lebih baik. Kata Kunci: Content Syndication, RSS, Windows Service, Band Object.
PENGKATEGORIAN ISI BERITA BERBAHASA INDONESIA MENGGUNAKAN ALGORITMA SYMBOLIC RULE INDUCTION BERBASIS DECISION TREE Purwananto, Yudhi; Purwitasari, Diana; Nugroho, Yos
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 3, No 1 Januari 2004
Publisher : Informatics, ITS

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (218.263 KB) | DOI: 10.12962/j24068535.v3i1.a131

Abstract

Pengkategorian teks sangat penting demi manajemen dan temu kembali pengetahuan yang ada pada teks tersebut. Pengkategorian teks yang dilakukan secara manual akan menghabiskan banyak waktu dan biaya. Karena itu diperlukan suatu sistem yang mampu mengkategorikan teks secara otomatis. Penelitian ini berusaha untuk mengkategorikan teks dengan menggunakan algoritma symbolic rule induction berbasis decision tree. Pengkategorian dilakukan untuk berita berbahasa Indonesia. Dari teks berita tersebut, dipilih fitur-fitur yang relevan untuk masing-masing kategori berdasarkan kriteria Information Gain. Dengan menggunakan fitur-fitur tersebut, dibangun decision tree melalui proses induksi. Untuk meningkatkan akurasi decision tree dilakukan proses pruning. Proses selanjutnya adalah menghasilkan aturan-aturan yang ekivalen secara logis dengan decision tree tersebut dengan memanfaatkan sibling criterion. Algoritma ini diuji coba dengan menggunakan data berita dari situs Detik. Uji coba dilakukan untuk mengetahui pengaruh dari jumlah fitur, jumlah data, dan nilai maksimum suatu fitur terhadap nilai F1 dan waktu komputasi. Hasil uji coba menunjukkan bahwa jumlah fitur dan jumlah data pelatihan yang bertambah cenderung akan meningkatkan nilai F1. Kata Kunci : Text Categorization, DTree, Sibling Criterion, Decision Tree, Symbolic Rule Induction
PEMILIHAN KOMBINASI PRODUK KOSMETIKA MENGGUNAKAN ALGORITMA GENETIKA Purwananto, Yudhi; Purwitasari, Diana; S., Putu Utami Andarini
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 5, No 2 Juli 2006
Publisher : Informatics, ITS

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (296.078 KB) | DOI: 10.12962/j24068535.v5i2.a236

Abstract

Pemilihan serangkaian produk kosmetik merupakan permasalahan kombinasi sebab seorang konsumen dapat memilih beberapa jenis produk. Pada pemilihan produk kosmetik akan melibatkan data berjumlah besar dengan setiap paket kosmetik merupakan kombinasi dari beragam produk yang terdapat di pasar. Algoritma genetika mampu melakukan optimasi terhadap permasalahan kombinasi yang melibatkan data berjumlah besar.Solusi-solusi dari pemilihan produk berupa paket-paket produk direpresentasikan dalam string-string biner. Satu string biner mewakili satu paket produk dengan setiap satu segmen terdiri dari beberapa bit merupakan representasi dari sebuah produk. Dilakukan tukar silang yang telah dimodifikasi dengan menentukan titik-titik yang akan dipilih sebagai titik tukar silang sejak pembentukan kromosom. Situasi kromosom yang tidak terdapat dalam database karena proses rekombinasi diatasi dengan dilakukan koreksi mutasi. Kromosom legal diterjemahkan dengan mengambil data-data berupa fitur-fitur produk, nama dan harga produk dari database. Data-data tersebut digunakan untuk melakukan perhitungan nilai fitness total yang bergantung pada rata-rata fitness produk dalam kromosom dan kesesuaian total harga produk dengan anggaran pengguna.Hasil pengujian menunjukkan apabila tanpa operator mutasi maka semakin besar tingkat tukar silang yang digunakan, jumlah generasi yang dibutuhkan untuk mencapai suatu nilai tertentu cenderung berkurang. Namun pada pemilihan produk, nilai fitness terbaik dihasilkan dengan pemakaian mutasi yaitu pada tingkat mutasi 0.09 dan tingkat tukar silang 0.7. Pemilihan metode tukar silang dua titik yang telah dimodifikasi pada pengujian tidak cukup baik hasilnya dibandingkan dengan tukar silang satu titik.Kata Kunci: algoritma genetika, pemilihan produk kosmetik, tukar silang, mutasi.
SISTEM PEMBANGKIT ANOTASI PADA ARTIKEL BERGAMBAR DENGAN PENDEKATAN KONTEKSTUAL Purwitasari, Diana; Saputra, Dian; Yuniar, Esti; Yuhana, Umi Laili; Siahaan, Daniel
JUTI: Jurnal Ilmiah Teknologi Informasi Vol 9, No 1, Januari 2011
Publisher : Informatics, ITS

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (553.833 KB) | DOI: 10.12962/j24068535.v9i1.a64

Abstract

Development of E-learning sites and their materials make it is necessary to help users finding the desired materials. Context-based search engine will help users for the finding task. However that kind of searching can only be done for learning materials that have been semantically signed or annotated. Annotation is given for the article’s content or the article’s image within. There are many constraints for manually providing annotations to the learning articles such that automatic metadata or annotation generating method is needed. This paper discusses about annotation generating system with two subsystems: annotation recommender for learning material using contextual analysis and image metadata generator. The methods for contextual analysis are Latent Semantic Analysis (LSA) and WordNet-lexical dictionary usage. Our experimental results showed that subsystems can be used to generate annotation for articles and images in the articles though we have not done combination of two subsystems.
PREFERENCE BASED TERM WEIGHTING FOR ARABIC FIQH DOCUMENT RANKING Holle, Khadijah Fahmi Hayati; Arifin, Agus Zainal; Purwitasari, Diana
Jurnal Ilmu Komputer dan Informasi Vol 8, No 1 (2015): Jurnal Ilmu Komputer dan Informasi (Journal of Computer Science and Information)
Publisher : Faculty of Computer Science - Universitas Indonesia

Show Abstract | Download Original | Original Source | Check in Google Scholar | Full PDF (381.084 KB) | DOI: 10.21609/jiki.v8i1.283

Abstract

In document retrieval, besides the suitability of query with search results, there is also a subjective user assessment that is expected to be a deciding factor in document ranking. This preference aspect is referred at the fiqh document searching. People tend to prefer on certain fiqh methodology without rejecting other fiqh methodologies. It is necessary to investigate preference factor in addition to the relevance factor in the document ranking. Therefore, this research proposed a method of term weighting based on preference to rank documents according to user preference. The proposed method is also combined with term weighting based on documents index and books index so it sees relevance and preference aspect. The proposed method is Inverse Preference Frequency with α value (IPFα). In this method, we calculate preference value by IPF term weighting. Then, the preference values of terms that is equal with the query are multiplied by α. IPFα combined with the existing weighting methods become TF.IDF.IBF.IPFα. Experiment of the proposed method uses dataset of several Arabic fiqh documents. Evaluation uses recall, precision, and f-measure calculations. Proposed term weighting method is obtained to rank the document in the right order according to user preference. It is shown from the result with recall value reach 75%, precision 100%, and f-measure 85.7% respectively.