A new count-distinct algorithm:
We present a simple, intuitive, sampling-based space-efficient algorithm whose description and the proof are accessible to undergraduates with the knowledge of basic probability theory.
Donald Knuth likes it: https://www-cs-faculty.stanford.edu/~knuth/papers/cvm-note.pdf
Their algorithm is not only interesting, it is extremely simple.
Furthermore, it’s wonderfully suited to teaching students who are learning the basics of computer science.
I’m pretty sure that something like this will eventually become a standard textbook topic.
There is the CWEB implementation he produced: cvm-estimates.w (archive.org)
Source: https://jmason.ie/2024/05/21/165901a.html
Interesting HackerNews comments: https://news.ycombinator.com/item?id=40379175
Cet article s’intéresse à l’évolution de la pratique du jeu de rôle à l’ère du numérique, principalement en France. Internet, le Web 2.0, et les autres dispositifs numériques sont pratiquement omniprésents dans notre société moderne. Les jeux, notamment les jeux de rôle, ne sont pas épargnés par cette imprégnation numérique puisque l’expérience de jeu des rôlistes est bien souvent augmentée et améliorée à travers ces nouveaux dispositifs. Ce travail se propose d’observer les nouveaux comportements et usages des rôlistes français dans leur pratique du jeu de rôle à l’ère du numérique grâce à un questionnaire soumis à de nombreux sujets (rôlistes). D’autre part, avec l’intégration des nouvelles technologies dans les univers ludiques, se pose la question de l’intégrité de l’essence du jeu de rôle dont les frontières sont souvent redéfinies.
Ugo Roux. Actual plays : quand le jeu de rôle sur table se médiatise. Recherches en communication, 2020, 49, pp.133-152. ⟨10.14428/rec.v49i49.57113⟩. ⟨hal-02899352⟩
Die shell script, DIE !
In this post, I'll show how easy it ease to convert fragile shell scripts to Python scripts, using sh.py. I'll use as an example a simple script to check your HTML code from the command-line, using the W3C validator.
Now you ask me, why the …
I often find myself grep
-ing for information in system or application log files. And often, by combining pipes, I end up generating a flow of values that is sometimes difficult to interpret.
In this post I'll show you a quick-and-dirty but handy solution to get basic statistical quantities from …