Voir le sujet précédent :: Voir le sujet suivant |
Auteur |
Message |
Wolin
Inscrit le: 27 Nov 2005 Messages: 2 Localisation: Paris
|
Posté le: Dim Nov 27, 2005 11:14 pm Sujet du message: Statistiques des mots les plus utilisés |
|
|
Bonjour , c'est pour savoir s'il est possible de baisser les statistiques des mots les plus utilisés a 5 lettres et si non pourquoi ?
si j'ai fait un nouveau topic et que je n'ai pas posé cette question sur un autre topic deja crée c'est pour éviter que la question soit reposer (meme si je pense que tout le monde s'en fout que ce soit des mots de 5 ou 6 lettres on est pas au scrabble ) |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Lun Nov 28, 2005 11:54 am Sujet du message: |
|
|
Seuls les mots d'au moins 6 lettres peuvent appaître dans le classement des mots les plus cités. Le but est d'éviter la présence récurrente (voire systématique) de mots très courants comme "aussi", "autre", "aucun", "merci" ou encore "salut". Evidemment le revers de la médaille est que cela trie aussi quelques mots significatifs.
Pour répondre plus précisemment à ta question, oui c'est possible de baisser la limite à 5 lettres (voire même 4 ou 3), mais ce sont justement les raisons présentées ci-dessus qui ont poussé à fixer la limite à 6.
Concernant la création de topic, tu as fait le bon choix. C'est encore le plus simple de créer un topic pour chaque question différente des autres. ^^
Et sinon non, tout le monde ne s'en fout pas de ces histoires de limite. Les preuves sont que :
- tu as posé la question lol
- ce post est un copier/coller de réponse à des mails posant la même question. _________________
|
|
Revenir en haut |
|
|
Invité
|
Posté le: Mer Déc 07, 2005 8:24 pm Sujet du message: |
|
|
Bonjour, est-ce que certains mots sont "bannis" des stats ? |
|
Revenir en haut |
|
|
Fly^SF Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 2 Localisation: Reims
|
Posté le: Jeu Déc 08, 2005 12:09 am Sujet du message: |
|
|
Bonjour Invité.
A ma connaissance aucun mot n'est banni des stats à moins que Fremen ne l'ait fait entre temps mais ça m'étonnerais beaucoup. De plus JV.com s'occupe déjà de filtrer en interdisant les mots qu'ils ne veulent pas voir dans leurs forums, il n'y a donc aucune raison que nous le fassions en plus |
|
Revenir en haut |
|
|
Amok
Inscrit le: 27 Nov 2005 Messages: 58
|
Posté le: Jeu Déc 08, 2005 8:22 am Sujet du message: |
|
|
sue quelques forums perdus les mots les plus cités sont parfois wwwwwwwww ou bien m*rd*... enfin vous m'avez compris... _________________ ~~ [-Amok-] ~~ |
|
Revenir en haut |
|
|
Whitesstripes
Inscrit le: 27 Nov 2005 Messages: 18
|
Posté le: Jeu Déc 08, 2005 6:58 pm Sujet du message: |
|
|
Oui ça c'est assez embétant.
Ca serait bien qu'il soit possible d'en bloquer oui... |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Jeu Déc 08, 2005 8:17 pm Sujet du message: |
|
|
Je confirme la réponse de Fly ^^
Au passage, simple précision, les mots dont la taille ne dépasse pas 5 caractères ne sont pas pris en compte dans le classement des mots les plus cités (ça permet de ne pas avoir les traditionnels "salut", "ouais", "voilà ", etc... dans ce classement).
Whitesstripes : C'est embêtant oui et non.
Non parce que sinon il faudrait tenir une liste à jour. Et qui dit tenir une liste à jour dit lire les propositions de chaque personne, les accepter quand elles semblent valides et prendre le temps d'expliquer pourquoi lorsqu'on refuse.
Et oui c'est embêtant quand des mots vraiments vulgaires apparaissent, sur ce point je ne peux que confirmer... mais je pense que dans l'ensemble c'est plutôt rare (?). _________________
|
|
Revenir en haut |
|
|
Invité
|
Posté le: Jeu Déc 08, 2005 8:58 pm Sujet du message: |
|
|
J'ai posé cette question car sur le forum fm2006, les mots nolife, footix, boulet, bolosse sont souvent cités mais n'appraîssent pas dans les stats, du moins pas d'aprés mes yeux |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Ven Déc 09, 2005 9:03 pm Sujet du message: |
|
|
C'est parce que ces mots ne sont pas assez cités pour apparaître dans le classement, tout simplement
- nolife : 572
- footix : 566
- boulet : 950
- bolosse : 146
Donc je confirme qu'il n'y a pas de censure. Et de toute façon ce serait dommage car finalement, insulte ou pas, ça reste un reflet du contenu des messages qui sont postés sur le forum concerné. _________________
|
|
Revenir en haut |
|
|
Invité
|
Posté le: Dim Déc 11, 2005 3:12 am Sujet du message: |
|
|
j'avais pourtant l'impression qu'ils étaient plus cité ces mots. |
|
Revenir en haut |
|
|
Amok
Inscrit le: 27 Nov 2005 Messages: 58
|
Posté le: Dim Déc 11, 2005 1:14 pm Sujet du message: |
|
|
il existe un petit probleme qui serait assez cool de regler... quoique pas urgent...
dans les mots les plus cités, on peut parfois trouver:
Rockstar 600
rockstar 300
et oui... les majuscules étant pris en compte, le mot Rockstar peut se trouver en deuxieme position au lieu de la premiere... juste a cause de l'orthographe _________________ ~~ [-Amok-] ~~ |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Dim Déc 11, 2005 2:53 pm Sujet du message: |
|
|
Invité : Oui mais ce n'est pas (encore) le cas Par contre ce sont peut-être des mots utilisés très fréquemment depuis peu de temps, ce qui donnerait cette impression.
Amok : Remarque très judicieuse. En fait sur ce point le programme a très mal été écrit à la base, dans le coup il est très difficile maintenant de revenir en arrière, ça demanderait trop de temps de calcul juste pour ne plus distinguer majuscules/minuscules (je te fais grâce des détails ^^).
En même temps je peux te sortir mon excuse à deux centimes d'Euros habituelle : les noms propres d'écrivent avec une majuscule et les noms communs sans majuscule. La seule exception est pour le premier mot de la phrase, mais ce premier mot joue rarement un rôle prépondérant Donc ce n'est pas de la faute du programme si les gens ne savent pas écrire ^^
Réponse un peu plus sérieuse : c'est le genre d'éléments qui seront pris en compte lors de la réécriture du programme de stats : non-distinction des accents, majuscules/minuscules, etc... Mais donc ce n'est pas pour demain ;) _________________
|
|
Revenir en haut |
|
|
Amok
Inscrit le: 27 Nov 2005 Messages: 58
|
Posté le: Lun Déc 12, 2005 10:18 am Sujet du message: |
|
|
ok merci de ta réponse... j'ai une autre question... meme si je pense connaitre la réponse...
certains pseudos sont enormements cités, mais ils contiennent moins de 6lettres, par exemple Max_ le modero des forums GTA... son nom est beaucoup cité, mais ne figure pas sur la liste car trop court, ne serait il pas possible "d'ajouter" des mots, c'est à dire de rentrer certains mots dans les données et ainsi voir apparaitre des mots importants de moins de 6lettres.
Autre solution, autoriser TOUT les mots à apparaitre, meme ceux de 1lettre, puis "bannir" certains mots comme "des" "de" "les" etc... ainsi les mots comme Max_ , GTA, LCS , MGS, FF9... pourrait enfin vivre...
je sais que ce que je demande est culoté... mais qui sais? _________________ ~~ [-Amok-] ~~ |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Mer Déc 14, 2005 9:42 am Sujet du message: |
|
|
Pour la possibilité d'ajouter des mots de moins de 6 lettres pouvant apparaître dans le classement, je confirme que ce serait assez gênant, pour trois raisons :
1) Pour chaque forum, le programme a un dictionnaire qui regroupe tous les mots différents qui ont été écrits. Ca en fait un sacré paquet. A l'heure actuelle, il se contente de faire un classement en fonction :
- du nombre de fois où chaque mot a été cité (ça revient à comparer des nombres) et
- du nombre de lettres dans le mot qui doit être supérieur ou égal à 6.
Ca demande du temps de calcul, mais c'est pas encore énorme. S'il fallait en plus, pour chaque mot, le comparer avec tous les mots de la liste des mots de moins de 6 lettres à accepter, ça augmenterait assez rapidement le temps de calcul d'un forum. Par exemple, admettons qu'il y ait 50.000 mots de moins de 6 lettres cités dans un forum et 500 mots de taille inférieure à 6 lettres à prendre en compte, il faudrait comparer chacun des 50.000 mots aux 500 mots en question. 50.000 x 500 = 25.000.000 comparaisons supplémentaires. Et pour comparer des mots, il faut comparer lettre par lettre pour vérifier si elles sont égales, en prenant en compte les majuscules/minuscules. Donc une comparaison demandera en moyenne trois comparaisons réelles. => 75.000.000 comparaisons lol
Une telle fonctionnalité demanderait probablement de réduire la fréquence des mises à jour de stats, actuellement de 14 jours.
2) Cela créerait des inégalités. Certains mots de 5 lettres seraient pris en compte et d'autres non. Je veux dire par là que certains "mériteraient" tout autant d'apparaître mais personne n'en fera la demande. Notamment par manque de savoir que la fonctionnalité existe. La plupart des visiteurs du site de stats ne savent même pas qu'il y a une page d'accueil avec un menu
3) Cela demanderait de gérer une liste et de faire faire le formulaire correspondant sur le site de stats. J'en reviens donc à une remarque citée plus haut : il faudrait tenir une liste à jour. Et qui dit tenir une liste à jour dit lire les propositions de chaque personne, les accepter quand elles semblent valides et prendre le temps d'expliquer pourquoi lorsqu'on refuse. Donc ça prend du temps mine de rien ^^
Amok a écrit: | Autre solution, autoriser TOUT les mots à apparaitre, meme ceux de 1lettre, puis "bannir" certains mots comme "des" "de" "les" etc... ainsi les mots comme Max_ , GTA, LCS , MGS, FF9... pourrait enfin vivre... |
Concernant l'affichage de tous les mots, il faudra bien en bannir 200 voire 300 par forum pour obtenir un classement correct. On en revient donc au même problème que en 1) ainsi que en 2) et en 3) d'aillleurs
Par contre c'est un "détail" qui sera mieux pris en charge par le futur programme de stats (si un jour je le finis, pour l'instant ça en est juste à l'étape "élaboration sur papier"). Le programme actuel a été mal pensé sur ce sujet, je te l'accorde volontier ^^ _________________
|
|
Revenir en haut |
|
|
Amok
Inscrit le: 27 Nov 2005 Messages: 58
|
Posté le: Mer Déc 14, 2005 7:00 pm Sujet du message: |
|
|
merci de ta réponse... je vois que la solution estb réduite et difficile...
mais tant pis... le nombre de mots sur un forum n'estb pas la stat la plus importante _________________ ~~ [-Amok-] ~~ |
|
Revenir en haut |
|
|
Googolplextor Invité
|
Posté le: Dim Jan 01, 2006 7:50 pm Sujet du message: |
|
|
Serait il possible d'intégrer un systeme de recherche "public" de la fréquence d'un mot sur un forum? |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Dim Jan 01, 2006 11:13 pm Sujet du message: |
|
|
Actuellement non c'est impossible car une fois calculées, les données de chaque forum sont intégralement compressées, un peu comme pour un fichier .zip ou .rar. Autrement dit, il faudrait décompresser les données, effectuer la recherche puis recompresser pour traiter chaque demande.
La future version du programme de stats (pas de date prévue pour le moment) devrait par contre pouvoir gérer sans aucun problème ce genre de fonctionnalités. Mais ce n'est pas pour demain _________________
|
|
Revenir en haut |
|
|
Googolplextor Invité
|
Posté le: Mer Jan 04, 2006 10:11 am Sujet du message: |
|
|
Est ce qu'il serait alors possible de faire deux classements: un normal, avec 6 lettres ou plus, et un autre avec tous les mots? Parce qu'il y a tous de même des mots pertinents (halo, grunt, flood..) qui mériteraient d'y paraitre. |
|
Revenir en haut |
|
|
Fremen Shit Fliez
Inscrit le: 26 Nov 2005 Messages: 817 Localisation: Lille
|
Posté le: Jeu Jan 05, 2006 12:15 am Sujet du message: |
|
|
Pour le moment j'ai trop de choses à faire (période d'examens et, concernant le programme de stats, terminer les modifications en cours de traitement).
Mais si tu veux, tu me rappelles ça dans quelques semaines ici même, et je te générerai les stats d'un forum quelconque, en prenant en compte tous les mots. (Et tu constateras par toi-même que la majorité des mots intéressants sont embourbés parmi une multitude de mots sans intérêt. ) _________________
|
|
Revenir en haut |
|
|
Amok
Inscrit le: 27 Nov 2005 Messages: 58
|
Posté le: Jeu Jan 05, 2006 8:28 am Sujet du message: |
|
|
période d'examen?
mais quel age as tu? lol, parce que je serais incapable de faire tout ce que tu fait... alors selon ton age en plus.... respect _________________ ~~ [-Amok-] ~~ |
|
Revenir en haut |
|
|
|