Etablissement | Université de Laghouat - Amar Telidji | Affiliation | Département d'Informatique | Auteur | ZIANI, Benameur | Directeur de thèse | QUINTEN Youcef (Maitre de conférence) | Filière | Informatique | Diplôme | Magister | Titre | Application des techniques de fouille de donnees à
l'analyse des ¯chiers log
(Cas des serveurs proxy de l'université de Laghouat) | Mots clés | Extraction des connaissances µa partir des donn¶ees, Fouille
de donn¶ees, Data Mining, Web Mining, ¯chier log, clustering k-means. | Résumé | Les techiques de fouilles de donn¶ees (Data Mining) peuvent ^etre utilis¶ees
pour d¶ecouvrir des modµeles cach¶es dans de grands volumes de donn¶ees. Avec
la croissance exponentielle du Web, les institutions, telles que les universit¶es,
collectent de grandes masses de donn¶ees dans les ¯chiers log de leurs serveurs
Web.
L'objectif principal de ce m¶emoire est l'application de quelques techniques
de fouille de donn¶ees pour analyser l'utilisation de la connexion Internet de
l'UATL (Universit¶e Amar T¶elidji de Laghouat). Cette connexion fait par-
tie du projet ARN (Academic Research Network) dont l'objectif principal
est d'o®rir µa tous les acteurs du secteur d'enseignement sup¶erieur une infra-
structure de communication et d'¶echanges. L'analyse porte sur deux aspects.
D'une part une ¶etude des navigations des utilisateurs en terme des pro¯ls
visit¶es, et d'autre part un regroupement (clustering) des utilisateurs selon
plusieurs critµeres retenus. Deux outils ont ¶et¶e utilis¶es pour r¶ealiser cette ana-
lyse. WebSpy Analyzer pour l'exploration des ¯chiers log et Weka pour
r¶ealiser un clustering des utilisateurs bas¶e sur l'algorithme K-means.
Les r¶esultats de l'exploration des ¯chiers log montrent une grande h¶et¶erog¶e-
nit¶e des pro¯ls visit¶es. Souvent la connexion µa la toile ne r¶epond pas µa des
¯ns prof¶essionnels. D'autre part l'¶echange avec d'autres institutions du projet
ARN est totalement absent. L'exp¶erience de clustering n'a pas donn¶e lieu µa
des groupes (clusters) qui se d¶etachent visiblement les uns des autres. Ceci
re°µetent un comportement identique chez l'ensemble des utilisateurs ind¶e-
pendemment de leurs pro¯ls (enseignent, ¶etudiant, personnel administratif). | Date de soutenance | 2007 | Pagination | I-XII-79p | Illusatration | ill.graph.;tabl.fig. | Format | 29cm | Notes | Bibliogr. | Statut | Soutenue |
|