bot que desa els tuts públics dels usuaris d'un servidor Mastodon que s'hi donin d'alta per a poder alimentar amb frases en #català diversos projectes lingüístics com ara Common Voice
Anar al arxiu
spla bd84443c3e Fix #2 2022-12-18 12:56:48 +01:00
LICENSE Primera versió de Corpus! 2022-12-01 17:34:13 +01:00
README.md Actualitzat 2022-12-02 18:59:52 +01:00
corpus.py Fix #2 2022-12-18 12:56:48 +01:00
database.py Fix #1 and added stats 2022-12-16 11:57:21 +01:00
mastodonbot.py Fix #1 and added stats 2022-12-16 11:57:21 +01:00
requeriments.txt Fix #1 and added stats 2022-12-16 11:57:21 +01:00

README.md

Corpus

Aquest bot desa els missatges públics dels usuaris d'un servidor Mastodon que s´hi donin d'alta. En qualsevol moment poden donar-se de baixa.

Al demanar l'alta en aquest bot, es pregunta a l'usuari confirmació de majoria d'edat, si accepta cedir a aquest projecte Corpus tots els seus tuts públics sota llicència CC0 i sí els tuts que escrigui no seran copies dels escrits per algú altre.
Al confirmar-ho tot, l'usuari permet alimentar amb frases escrites en català projectes lingüístics com per exemple Common Voice.

En el cas del bot corpus de mastodont.cat, els tuts públics desats es pujaran de manera periòdica i anonimitzada a aquest repositori.

Com donar-se d'alta o de baixa

Demanar-ho al bot, mencionant-lo:

@bot alta
@bot baixa

Tots els usuaris donats d'alta poden esborrar quan ho desitgin tots els missatges que el bot tingui desats:

@bot esborra

Com instal·lar aquest bot

Dependències

  • Python 3
  • Servidor Postgresql
  • Un compte Mastodon per aquest bot

Dins del entorn virtual Python:

  1. Executar pip install -r requirements.txt per a instal·lar les llibreries necessàries.

  2. Executar python corpus.py per a fer la configuració inicial del bot de Mastodon i per a crear la base de dades Postgresql on desar els missatges públics.

  3. Configurar cron per a que executi python corpus.py cada minut.