#!/bin/bash set -e for tool in sqlite3 getopt mktemp w3m jq; do which $tool > /dev/null 2>&1 || { echo missing tool $tool exit 1 } done IFS_=$IFS function sqlite_request () { sqlite3 ${2:+-cmd} ${2:+".mode $2"} "$in_ram_database" <<< "$1" } function create_database () { sqlite_request "create table if not exists dossiers (id integer primary key, titre text, url text)" sqlite_request "create table if not exists votes (id integer primary key, nom text)" sqlite_request "create table if not exists députés (id integer primary key, nom text, groupe integer, date text)" sqlite_request "create table if not exists groupes (id integer primary key, nom text unique, nom_court text)" sqlite_request "create table if not exists scrutins (num integer primary key, séance text, date text not null, intitulé text non null, adoption boolean, dossier integer, mise_au_point text)" sqlite_request "create table if not exists dépouillements (scrutin integer not null, député integer not null, vote integer not null)" sqlite_request "create unique index if not exists 'index_députés' on députés (nom, groupe)" sqlite_request "create unique index if not exists 'index_dossiers' on dossiers (titre, url)" sqlite_request "create unique index if not exists 'index_dépouillements' on dépouillements (député, scrutin)" for v in Pour Contre Abstention Non-votant; do sqlite_request "insert or ignore into votes (nom) values ('$v')" done } function update_database () { test "$no_db_update" = $true_flag && return tempfile="/dev/shm/scrutin.$$" progress=0 for r in "${!acronymes[@]}"; do sqlite_request "update groupes set nom_court = \"${acronymes[$r]}\" where nom = \"$r\"" done sqlite_request "create table if not exists dossier_par_scrutin (scrutin integer, url text)" echo "récupération des dossiers" wget -qO- "https://www.assemblee-nationale.fr/dyn/$mandature/dossiers" \ | sed -rn 's/

([^<]+)<.+$/\1 \2/p' \ | sed -r "s/^[[:space:]]*//; s/'/'/g" \ | awk -v dq='"' '{ printf("insert or ignore into dossiers (titre, url) values (%s, %s);\n", dq gensub($1 " ", "", "1", $0) dq, dq "https://www.assemblee-nationale.fr" $1 dq) }' > $tempfile sqlite3 "$in_ram_database" < $tempfile first_=$first first=$(sqlite_request "select max(num) from scrutins") if test ${first:-0} -lt $last; then echo "récupération des scrutins n°$((${first:-0}+1)) à n°$last dans "$database" (à conserver autant que possible)" >&2 test $((last % 100)) -ne 0 && last_offset=0 IFS=$' \t\n' for offset in $(seq $((last - 100)) -100 ${first:-0} ) $last_offset; do wget -qO- "http://www2.assemblee-nationale.fr/scrutins/liste/(offset)/$offset/(legislature)/$mandature/(type)/TOUS/(idDossier)/TOUS" \ | awk -v dq='"' ' BEGIN { } // { scrutin = gensub(/^.+denom.>([[:digit:]]+)\\*?<.td./,"\\1","1",$0) } // { if (match($0, ">dossier<") > 0) dossier[scrutin] = gensub(/^.+.dossier<.a>.*$/,"\\1","1",$0) } END { for (i in dossier) { printf("insert into dossier_par_scrutin (scrutin, url) values (%i, %s);\n", i, dq dossier[i] dq) } }' > $tempfile sqlite3 "$in_ram_database" < $tempfile done # IFS=$'\n' begin=$(date +%s) for scrutin in $(seq $((${first:-0}+1)) $last); do w3m -cols 512 -dump "http://www2.assemblee-nationale.fr/scrutins/detail/(legislature)/$mandature/(num)/$scrutin" \ | sed -n '/^Analyse du scrutin n° /,/^Votes des groupes/{/^Navigation/,/^ • Non inscrits/d;/^[[:space:]]*$/d;p}' \ | awk -v sq="'" -v dq='"' ' BEGIN { adoption = -1; map = 0 } /^Analyse du scrutin/ { scrutin = $NF } /séance du [0-3][0-9]\/[01][0-9]\/(19|20)[0-9]+/ { date = $NF; seance = $1 } /^Scrutin public sur / { titre = gensub("^Scrutin public sur l[ae" sq "]s? ?", "", "1") } /^L.Assemblée .+ adopté/ { adoption = NF == 3 } /^Nombre de votants :/ { votants = $NF } /^Nombre de suffrages exprimés :/ { exprimes = $NF } /^Majorité absolue :/ { majo_absolue = $NF } /^Pour l.adoption :/ { pour = $NF } /^Contre :/ { contre = $NF } /^Groupe / { groupe = gensub("^Groupe (.+) \\([1-9].+$", "\\1", "1") groupe = gensub("^(la|les|le|l" sq "|du|des|de|de la|d" sq ") ", "", "1", groupe) } /^Non inscrits/ { groupe = "Non inscrits" } /^(Pour|Abstention|Contre):/ { position = gensub(":", "", "1", $1) } /^Non-votants?:/ { position = gensub("s?:", "", "1", $1) nvl = "" while ($1 != "Groupe") { getline if ($1 == "Groupe") break nvl = nvl $0 } f = split(nvl, nv, "(, | et )") for (i=1; i<=f; i++) { votes[groupe][position][gensub("(^ +|M\\. |Mme |Mlle | \\(.+)", "", "g", nv[i])]++ } groupe = gensub("^Groupe (.+) \\([1-9].+$", "\\1", "1") } /^ • / { votes[groupe][position][gensub("^[[:punct:] ]*", "", "1")]++ } /^Mises au point/,/^Votes des groupes/ { if ($1 != "(Sous") mises_au_point[map++] = $0 } END { if (adoption < 0) adoption = pour >= majo_absolue for (i=1; i $tempfile sqlite3 "$in_ram_database" < $tempfile if test $(( ($scrutin - ${first:-0}) * 100 / ( $last - ${first:-0} ) )) -ne ${progress:-0}; then progress=$(( ($scrutin - ${first:-0}) * 100 / ( $last - ${first:-0} ) )) if test $(($progress % ${update_progress:-1})) -eq 0; then now=$(date +%s) delta=$(( $now - $begin )) # scrutin = {first:-0}+1 à la première itération printf "\r%d%%, ETA %s" $progress $(date +%H:%M:%S -d "$(($delta * ($last - $scrutin) / ($scrutin - ${first:-0}) )) seconds") fi fi done sqlite_request 'drop table dossier_par_scrutin' echo -e "\r\033[KTerminé: $(($scrutin - ${first:-0} - 1)) scrutins ajoutés" rm -f "$tempfile" fi first=$first_ } function write_comparaison () { result="comparaisons ${groupe[0]} avec ${groupe_ref:-GDR}${dossier:+ - ${dossier}}" content="/dev/shm/$result/content.xml" id_cols=(Scrutin Date Scéance Titre Adoption Panurgisme${nom:+ Participation Loyauté} Dossier) eval $(sqlite_request 'select printf("typevotes[%i]=%s;", id, nom) from votes') nb_cols=$(( ${#id_cols[@]} + ${#typevotes[@]} * ${#groupe[@]} )) last_col=$(awk -v n=$nb_cols 'BEGIN{printf("%c%c", n < 27 ? "" : int(n/26) + 64, (n % 26) + (n % 26 == 0 ? 26 : 0) + 64)}' | tr -d '\0') function write_cell () { case $1 in url) cell='' cell+="$3" ;; texte) cell='' cell+="$2" ;; nombre) cell="" cell+="$2" ;; *) return 1;; esac cell+='' echo $cell >> "$content" } echo "génération du fichier $result" mkdir -p "/dev/shm/$result/META-INF" cat > "/dev/shm/$result/META-INF/manifest.xml" << EOmetainf EOmetainf printf 'application/vnd.oasis.opendocument.spreadsheet' > "/dev/shm/$result/mimetype" echo '' > "$content" cat >> "$content" << EOcontent EOcontent IFS=$'\n' for i in $(seq $nb_cols); do cat >> "$content" << EOcontent EOcontent done cat >> "$content" << EOcontent EOcontent for i in $(seq ${#typevotes[@]}); do cat >> "$content" << EOcontent EOcontent for (( g = 1; g < ${#groupe[@]}; g++ )); do cat >> "$content" << EOcontent EOcontent done done echo '' >> "$content" IFS=$IFS_ for colonne in ${id_cols[@]}; do write_cell texte $colonne done for typevote in ${typevotes[@]}; do for g in "${groupe[@]}"; do write_cell texte "$typevote - $g" done done echo '' >> "$content" progress=0 begin=$(date +%s) line=1 test -z "$seq" && qty=$(( $last - $first )) IFS=$'\n' scrutin_base_url="https://www2.assemblee-nationale.fr/scrutins/detail/(legislature)/$mandature/(num)/" for scrutin in $(eval ${seq:-seq $first $last}); do data=$(sqlite_request "select date,séance,intitulé,adoption,dossiers.url,dossiers.titre from scrutins left join dossiers on scrutins.dossier = dossiers.id where num is $scrutin" json) date=$(jq -r '.[].date' <<< $data) seance=$(jq -r '.[]."séance"' <<< $data) title=$(jq -r '.[]."intitulé" | @html' <<< $data) adoption=$(jq '.[].adoption' <<< $data) dossier_url=$(jq '.[].url' <<< $data) dossier_texte=$(jq -r '.[].titre | @html' <<< $data) test $adoption -eq 1 && adoption='oui' || adoption='non' echo '' >> "$content" write_cell url "\"$scrutin_base_url$scrutin\"" $scrutin write_cell texte "$date" write_cell texte "$seance" write_cell texte "$title" write_cell texte "$adoption" for typevote in $(seq ${#typevotes[@]}); do vote_cible[$typevote]=$(sqlite_request "select count(député) from dépouillements inner join députés, groupes on députés.groupe = groupes.id and dépouillements.député = députés.id where scrutin is $scrutin and vote is $typevote and groupes.id = ${groupe_id[0]} ${nom:+ and députés.nom is \"${nom}\"}") done if test \( ${vote_cible[1]} -gt ${vote_cible[2]} -a $adoption = oui \) \ -o \( ${vote_cible[2]} -gt ${vote_cible[1]} -a $adoption = non \); then panurge=oui else panurge=non fi write_cell texte $panurge if test -n "$nom"; then for typevote in 1 2; do votes_g0[$typevote]=$(sqlite_request "select count(député) from dépouillements inner join députés, groupes on députés.groupe = groupes.id and dépouillements.député = députés.id where scrutin is $scrutin and vote is $typevote and groupes.id is ${groupe_id[0]}") done participation=$(( vote_cible[1] + vote_cible[2] + vote_cible[3] + vote_cible[4] )) if test $(( (${votes_g0[1]} - ${votes_g0[2]}) * (${vote_cible[1]} - ${vote_cible[2]}) )) -gt 0; then loyaute=oui else loyaute=non fi write_cell nombre $participation write_cell texte $loyaute fi write_cell url "${dossier_url/#null/\"\"}" "${dossier_texte/#null}" for typevote in $(seq ${#typevotes[@]}); do write_cell nombre ${vote_cible[$typevote]} for (( g = 1; g < ${#groupe_id[@]}; g++ )); do votes=$(sqlite_request "select count(député) from dépouillements inner join députés, groupes on députés.groupe = groupes.id and dépouillements.député = députés.id where scrutin is $scrutin and vote is $typevote and groupes.id is ${groupe_id[$g]}") write_cell nombre $votes done done echo '' >> "$content" if test $(( ($line * 100) / ${qty:-$last} )) -ne $progress; then progress=$(( ($line * 100) / ${qty:-$last} )) if test $(( $progress % ${generation_progress:-5} )) -eq 0; then now=$(date +%s) delta=$(( $now - $begin )) printf "\r%d%%, ETA %s" $progress $(date +%H:%M:%S -d "$(( $delta * (${qty:-$last} - $line) / $line )) seconds") fi fi let line++ done cat >> "$content" << EOcontent EOcontent ( cd "/dev/shm/$result" && zip -r ../"$result" * > /dev/null 2>&1 && cd .. && rm -fr "$result" ) mv -f "/dev/shm/$result.zip" "${destination_path:+$destination_path/}$result.ods" echo -e "\r\033[KTerminé : ${destination_path:+$destination_path/}$result.ods" } function save_database () { test -n "$result" -a -d "/dev/shm/$result" && rm -fr "/dev/shm/$result" test -n "$database" -a -n "$in_ram_database" || return if test -r "$database" && sqldiff=$(sqldiff $in_ram_database $database) && test -z "$sqldiff"; then echo "pas de modification" elif test -w "$database"; then rm -f "$database" sqlite_request '.dump' | sqlite3 "$database" echo "base de données $database mise à jour" elif test ! -e "$database" -a -w ${database%/*}; then sqlite_request '.dump' | sqlite3 "$database" echo "base de données $database créée" else echo "je ne peux rien faire avec $database !" fi rm -f "$in_ram_database" "$tempfile" } function dernier_scrutin_public () { wget -qO- "http://www2.assemblee-nationale.fr/scrutins/liste/(legislature)/$mandature/(type)/TOUS/(idDossier)/TOUS" \ | sed -rn 's/^.*([0-9]+)[^0-9].*$/\1/p' \ | head -1 } trap save_database EXIT test -z "$database" && database="${0}.db" declare -A acronymes if test -n "$config_file"; then source "$config_file" else config_file="${0}.conf" if test -r "$config_file"; then source "$config_file" fi fi true_flag=$(mktemp --dry-run XXXXX) while [[ $# -gt 0 ]]; do case "$1" in "--no-db-update") #|ne met pas à jour la base de données no_db_update=$true_flag;; "--db-update-only") #|ne génère pas de fichier de résultat db_update_only=$true_flag;; "--cible") #|génère un comparatif pour ce groupe. Par défaut Renaissance groupe[0]="${2}" shift;; "--ref") #|compare avec ce ou ces groupes. Si plusieurs groupes, ils sont séparés par une virgule, sans espace. Par défaut GDR groupe_ref="${2}" shift;; "--député") #|filtre la cible sur un-e député-e sur le groupe cible (par défaut Renaissance). est insensible à la casse. Tout ou partie du nom ou du prénom peut être donné, espace compris. Caractère % utilisé comme caractère joker. Si aucune correspondance n'est trouvée avec un-e député-é, sortie en erreur. Si plusieurs député-e-s correspondent la liste est affichée et sortie en erreur. depute=$true_flag nom="$2" shift;; "--mandature") mandature="$2" ;; "--premier-scrutin") #|commence la génération du résultat à partir du scrutin no_db_update=$true_flag first="$2" shift;; "--dernier-scrutin") #|termine la génération du résultat au scrutin no_db_update=$true_flag last="$2" shift;; "--période") #|génère un résultat pour les scrutins allant de jj/mm/aaaa à JJ/MM/AAAA periode=$true_flag no_db_update=$true_flag periode_value="$2" shift;; "--liste-députés-du-groupe") #|liste les député-e-s du groupe sur la mandature liste_deputes=$true_flag liste_deputes_value="${2}" shift;; "--liste-députés") #|liste tou-te-s les député-e-s de la mandature liste_deputes=$true_flag;; "--liste-dossiers") #|affiche une liste numérotée des dossiers et sort liste_dossiers=$true_flag;; "--dossier") #|génère un résultat pour le dossier numéroté dossier=$true_flag dossier_value="$2" shift;; "--dossiers") #|sélection interactive du dossier dossier=$true_flag;; "--conf") #|indique le chemin vers le fichier de configuration. Par défaut "{_}.conf" test -r "$2" || { echo "config introuvable $2" >&2 options_error=$true_flag } config_file="$2" shift;; "--dest") #|génère le fichier dans le répertoire spécifié. Par défaut $PWD if test -n "$2" && test -d "$2" -a -r "$2"; then destination_path="$2" shift else echo "$2 n'est pas un répertoire ou n'est pas autorisé en écriture" >&2 exit 1 fi;; "--database") #|indique le chemin vers la base de données SQLite3 contenant les informations. Par défaut "{_}.db" if test -r "$2" && file -b "$2" | grep -q '^SQLite 3.x database'; then echo "erreur sur option database: fichier '$2' introuvable ou pas une base SQLite 3" >&2 options_error=$true_flag fi database="$2" shift;; "--progrès-génération") #|affiche de la progression de la génération du fichier tous les %. Par défaut 5 generation_progress="$2" shift;; "--progrès-update") #|affiche de la progression de la mise à jour de la base de données tous les %. Par défaut 1 update_progress="$2" shift;; "--help") #|affiche cette aide et quitte echo "$0 [options]" echo "génère un classeur ODS pour comparer les scrutins publics de la 15ème mandature à l'Assemblée Nationale" echo sed -rn '/^ *"--.+"\)/N; s/^ *"(--.+)"\)\n#(.+)$/\1|\2/p' "$0" \ | awk -F'|' -v marge=' ' -v prog="$0" '{ printf("%s %s\n" marge "%s\n\n", $1, $2, gensub("\\. ", "\\\n" marge, "g", gensub("\\{_\\}", prog, "g", $3))) }' exit;; esac shift done test "$options_error" = $true_flag && exit 1 IFS=',' groupe=(${groupe[0]:-Renaissance} ${groupe_ref:-GDR}) in_ram_database=$(mktemp --dry-run /dev/shm/XXXXXXXXXXXX) if test -r "$database"; then cp "$database" "$in_ram_database" else create_database fi function check_groupes () { nb_groupe=$(sqlite_request "select count(id) from groupes where nom like \"%$1%\" or nom_court is \"$1\"") if test $nb_groupe -eq 0; then echo "aucun groupe ne correspond au critère $1" >&2 exit 1 elif test $nb_groupe -gt 1; then echo "plusieurs groupes correspondent au critère $1" >&2 sqlite_request "select printf('• %s%s', nom, iif(nom_court is not null, ' [' || nom_court || ']', '')) from groupes where nom like \"%$1%\" or nom_court = \"$1\"" | grep --color -i "$1" >&2 exit 1 fi } if test "$periode" = $true_flag; then function get_date () { sqlite_request "select distinct(date) from scrutins order by num asc" | awk -v d="$1" -v comp=$2 ' function norm_date (date) { split(date, a, "/") return sprintf("%s%s%s", length(a[3]) == 4 ? a[3] : length(a[3]) == 2 ? "20" a[3] : strftime("%Y", systime()), length(a[2]) == 2 ? a[2] : "0" a[2], length(a[1]) == 2 ? a[1] : "0" a[1]) } function output (date) { print date found = 1 exit } BEGIN { d = norm_date(d) } { s = norm_date($1) if (NR == 1 && s > d && comp == "first") output($1) if (s >= d && comp == "first") output($1) if (s == d && comp == "last") output($1) if (s > d && comp == "last") output(previous) previous = $1 } END { if (!found) print previous }' } first=$(sqlite_request "select min(num) from scrutins where date = '$(get_date ${periode_value%:*} first)'") last=$(sqlite_request "select max(num) from scrutins where date = '$(get_date ${periode_value#*:} last)'") elif test "$dossier" != $true_flag; then test -z "$last" && last=$(dernier_scrutin_public) test -z "$first" && first=1 fi if test "$liste_dossiers" = $true_flag; then sqlite_request "select printf('• %s (%s)', titre, url) from dossiers" exit fi if test "$db_update_only" = $true_flag; then unset first last last=$(dernier_scrutin_public) update_database exit fi for (( g = 0; g < ${#groupe[@]}; g++ )); do check_groupes "${groupe[$g]}" groupe_id[$g]=$(sqlite_request "select id from groupes where nom like \"%${groupe[$g]}%\" or nom_court is '${groupe[$g]}'") done if test "$liste_deputes" = $true_flag; then if test -n "$liste_deputes_value"; then sqlite_request "select printf('%s - %s%s', députés.nom, groupes.nom, iif(groupes.nom_court is not null, ' [' || groupes.nom_court || ']', '')) from députés inner join groupes on groupes.id = députés.groupe where groupes.nom like '%$liste_deputes_value%' or groupes.nom_court = '$liste_deputes_value'" else sqlite_request "select printf('%s - %s%s', députés.nom, groupes.nom, iif(groupes.nom_court is not null, ' [' || groupes.nom_court || ']', '')) from députés inner join groupes on groupes.id = députés.groupe order by groupes.nom asc" fi exit fi if test "$depute" = $true_flag; then if test -n "$nom"; then match=$(sqlite_request "select count(députés.id) from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase") if test $match -eq 0; then echo "pas de député correspondant à $nom dans le groupe $groupe" exit 1 elif test $match -gt 1; then echo "plusieurs députés correspondent à $nom:" sqlite_request "select députés.nom from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase" exit 1 else groupe[0]=$(sqlite_request "select printf('%s (%s)', députés.nom, groupes.nom) from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase") nom=${groupe[0]%% (*} fi fi fi update_database write_comparaison