#!/bin/bash
set -e
for tool in sqlite3 getopt mktemp w3m jq; do
which $tool > /dev/null 2>&1 || {
echo missing tool $tool
exit 1
}
done
IFS_=$IFS
function sqlite_request () {
sqlite3 ${2:+-cmd} ${2:+".mode $2"} "$in_ram_database" <<< "$1"
}
function create_database () {
sqlite_request "create table if not exists dossiers (id integer primary key, titre text, url text)"
sqlite_request "create table if not exists votes (id integer primary key, nom text)"
sqlite_request "create table if not exists députés (id integer primary key, nom text, groupe integer, date text)"
sqlite_request "create table if not exists groupes (id integer primary key, nom text unique, nom_court text)"
sqlite_request "create table if not exists scrutins (num integer primary key, séance text, date text not null, intitulé text non null, adoption boolean, dossier integer, mise_au_point text)"
sqlite_request "create table if not exists dépouillements (scrutin integer not null, député integer not null, vote integer not null)"
sqlite_request "create unique index if not exists 'index_députés' on députés (nom, groupe)"
sqlite_request "create unique index if not exists 'index_dossiers' on dossiers (titre, url)"
sqlite_request "create unique index if not exists 'index_dépouillements' on dépouillements (député, scrutin)"
for v in Pour Contre Abstention Non-votant; do
sqlite_request "insert or ignore into votes (nom) values ('$v')"
done
}
function update_database () {
test "$no_db_update" = $true_flag && return
tempfile="/dev/shm/scrutin.$$"
progress=0
for r in "${!acronymes[@]}"; do
sqlite_request "update groupes set nom_court = \"${acronymes[$r]}\" where nom = \"$r\""
done
sqlite_request "create table if not exists dossier_par_scrutin (scrutin integer, url text)"
echo "récupération des dossiers"
wget -qO- "https://www.assemblee-nationale.fr/dyn/$mandature/dossiers" \
| sed -rn 's/
([^<]+)<.+$/\1 \2/p' \
| sed -r "s/^[[:space:]]*//; s/'/'/g" \
| awk -v dq='"' '{
printf("insert or ignore into dossiers (titre, url) values (%s, %s);\n", dq gensub($1 " ", "", "1", $0) dq, dq "https://www.assemblee-nationale.fr" $1 dq)
}' > $tempfile
sqlite3 "$in_ram_database" < $tempfile
first_=$first
first=$(sqlite_request "select max(num) from scrutins")
if test ${first:-0} -lt $last; then
echo "récupération des scrutins n°$((${first:-0}+1)) à n°$last dans "$database" (à conserver autant que possible)" >&2
test $((last % 100)) -ne 0 && last_offset=0
IFS=$' \t\n'
for offset in $(seq $((last - 100)) -100 ${first:-0} ) $last_offset; do
wget -qO- "http://www2.assemblee-nationale.fr/scrutins/liste/(offset)/$offset/(legislature)/$mandature/(type)/TOUS/(idDossier)/TOUS" \
| awk -v dq='"' '
BEGIN {
}
/
/ {
scrutin = gensub(/^.+denom.>([[:digit:]]+)\\*?<.td./,"\\1","1",$0)
}
/ | / {
if (match($0, ">dossier<") > 0)
dossier[scrutin] = gensub(/^.+.dossier<.a>.*$/,"\\1","1",$0)
}
END {
for (i in dossier) {
printf("insert into dossier_par_scrutin (scrutin, url) values (%i, %s);\n", i, dq dossier[i] dq)
}
}' > $tempfile
sqlite3 "$in_ram_database" < $tempfile
done
# IFS=$'\n'
begin=$(date +%s)
for scrutin in $(seq $((${first:-0}+1)) $last); do
w3m -cols 512 -dump "http://www2.assemblee-nationale.fr/scrutins/detail/(legislature)/$mandature/(num)/$scrutin" \
| sed -n '/^Analyse du scrutin n° /,/^Votes des groupes/{/^Navigation/,/^ • Non inscrits/d;/^[[:space:]]*$/d;p}' \
| awk -v sq="'" -v dq='"' '
BEGIN { adoption = -1; map = 0 }
/^Analyse du scrutin/ { scrutin = $NF }
/séance du [0-3][0-9]\/[01][0-9]\/(19|20)[0-9]+/ { date = $NF; seance = $1 }
/^Scrutin public sur / { titre = gensub("^Scrutin public sur l[ae" sq "]s? ?", "", "1") }
/^L.Assemblée .+ adopté/ { adoption = NF == 3 }
/^Nombre de votants :/ { votants = $NF }
/^Nombre de suffrages exprimés :/ { exprimes = $NF }
/^Majorité absolue :/ { majo_absolue = $NF }
/^Pour l.adoption :/ { pour = $NF }
/^Contre :/ { contre = $NF }
/^Groupe / { groupe = gensub("^Groupe (.+) \\([1-9].+$", "\\1", "1")
groupe = gensub("^(la|les|le|l" sq "|du|des|de|de la|d" sq ") ", "", "1", groupe)
}
/^Non inscrits/ { groupe = "Non inscrits" }
/^(Pour|Abstention|Contre):/ { position = gensub(":", "", "1", $1) }
/^Non-votants?:/ {
position = gensub("s?:", "", "1", $1)
nvl = ""
while ($1 != "Groupe") {
getline
if ($1 == "Groupe")
break
nvl = nvl $0
}
f = split(nvl, nv, "(, | et )")
for (i=1; i<=f; i++) {
votes[groupe][position][gensub("(^ +|M\\. |Mme |Mlle | \\(.+)", "", "g", nv[i])]++
}
groupe = gensub("^Groupe (.+) \\([1-9].+$", "\\1", "1")
}
/^ • / { votes[groupe][position][gensub("^[[:punct:] ]*", "", "1")]++ }
/^Mises au point/,/^Votes des groupes/ { if ($1 != "(Sous") mises_au_point[map++] = $0 }
END {
if (adoption < 0)
adoption = pour >= majo_absolue
for (i=1; i $tempfile
sqlite3 "$in_ram_database" < $tempfile
if test $(( ($scrutin - ${first:-0}) * 100 / ( $last - ${first:-0} ) )) -ne ${progress:-0}; then
progress=$(( ($scrutin - ${first:-0}) * 100 / ( $last - ${first:-0} ) ))
if test $(($progress % ${update_progress:-1})) -eq 0; then
now=$(date +%s)
delta=$(( $now - $begin ))
# scrutin = {first:-0}+1 à la première itération
printf "\r%d%%, ETA %s" $progress $(date +%H:%M:%S -d "$(($delta * ($last - $scrutin) / ($scrutin - ${first:-0}) )) seconds")
fi
fi
done
sqlite_request 'drop table dossier_par_scrutin'
echo -e "\r\033[KTerminé: $(($scrutin - ${first:-0} - 1)) scrutins ajoutés"
rm -f "$tempfile"
fi
first=$first_
}
function write_comparaison () {
result="comparaisons ${groupe[0]} avec ${groupe_ref:-GDR}${dossier:+ - ${dossier}}"
content="/dev/shm/$result/content.xml"
id_cols=(Scrutin Date Scéance Titre Adoption Panurgisme${nom:+ Participation Loyauté} Dossier)
eval $(sqlite_request 'select printf("typevotes[%i]=%s;", id, nom) from votes')
nb_cols=$(( ${#id_cols[@]} + ${#typevotes[@]} * ${#groupe[@]} ))
last_col=$(awk -v n=$nb_cols 'BEGIN{printf("%c%c", n < 27 ? "" : int(n/26) + 64, (n % 26) + (n % 26 == 0 ? 26 : 0) + 64)}' | tr -d '\0')
function write_cell () {
case $1 in
url)
cell=''
cell+="$3"
;;
texte)
cell=''
cell+="$2"
;;
nombre)
cell=""
cell+="$2"
;;
*)
return 1;;
esac
cell+=''
echo $cell >> "$content"
}
echo "génération du fichier $result"
mkdir -p "/dev/shm/$result/META-INF"
cat > "/dev/shm/$result/META-INF/manifest.xml" << EOmetainf
EOmetainf
printf 'application/vnd.oasis.opendocument.spreadsheet' > "/dev/shm/$result/mimetype"
echo '' > "$content"
cat >> "$content" << EOcontent
EOcontent
IFS=$'\n'
for i in $(seq $nb_cols); do
cat >> "$content" << EOcontent
EOcontent
done
cat >> "$content" << EOcontent
EOcontent
for i in $(seq ${#typevotes[@]}); do
cat >> "$content" << EOcontent
EOcontent
for (( g = 1; g < ${#groupe[@]}; g++ )); do
cat >> "$content" << EOcontent
EOcontent
done
done
echo '' >> "$content"
IFS=$IFS_
for colonne in ${id_cols[@]}; do
write_cell texte $colonne
done
for typevote in ${typevotes[@]}; do
for g in "${groupe[@]}"; do
write_cell texte "$typevote - $g"
done
done
echo '' >> "$content"
progress=0
begin=$(date +%s)
line=1
test -z "$seq" && qty=$(( $last - $first ))
IFS=$'\n'
scrutin_base_url="https://www2.assemblee-nationale.fr/scrutins/detail/(legislature)/$mandature/(num)/"
for scrutin in $(eval ${seq:-seq $first $last}); do
data=$(sqlite_request "select date,séance,intitulé,adoption,dossiers.url,dossiers.titre from scrutins left join dossiers on scrutins.dossier = dossiers.id where num is $scrutin" json)
date=$(jq -r '.[].date' <<< $data)
seance=$(jq -r '.[]."séance"' <<< $data)
title=$(jq -r '.[]."intitulé" | @html' <<< $data)
adoption=$(jq '.[].adoption' <<< $data)
dossier_url=$(jq '.[].url' <<< $data)
dossier_texte=$(jq -r '.[].titre | @html' <<< $data)
test $adoption -eq 1 && adoption='oui' || adoption='non'
echo '' >> "$content"
write_cell url "\"$scrutin_base_url$scrutin\"" $scrutin
write_cell texte "$date"
write_cell texte "$seance"
write_cell texte "$title"
write_cell texte "$adoption"
for typevote in $(seq ${#typevotes[@]}); do
vote_cible[$typevote]=$(sqlite_request "select
count(député)
from
dépouillements
inner join
députés, groupes
on
députés.groupe = groupes.id and dépouillements.député = députés.id
where
scrutin is $scrutin
and
vote is $typevote
and
groupes.id = ${groupe_id[0]} ${nom:+ and députés.nom is \"${nom}\"}")
done
if test \( ${vote_cible[1]} -gt ${vote_cible[2]} -a $adoption = oui \) \
-o \( ${vote_cible[2]} -gt ${vote_cible[1]} -a $adoption = non \); then
panurge=oui
else
panurge=non
fi
write_cell texte $panurge
if test -n "$nom"; then
for typevote in 1 2; do
votes_g0[$typevote]=$(sqlite_request "select
count(député)
from
dépouillements
inner join
députés, groupes
on
députés.groupe = groupes.id and dépouillements.député = députés.id
where
scrutin is $scrutin
and
vote is $typevote
and
groupes.id is ${groupe_id[0]}")
done
participation=$(( vote_cible[1] + vote_cible[2] + vote_cible[3] + vote_cible[4] ))
if test $(( (${votes_g0[1]} - ${votes_g0[2]}) * (${vote_cible[1]} - ${vote_cible[2]}) )) -gt 0; then
loyaute=oui
else
loyaute=non
fi
write_cell nombre $participation
write_cell texte $loyaute
fi
write_cell url "${dossier_url/#null/\"\"}" "${dossier_texte/#null}"
for typevote in $(seq ${#typevotes[@]}); do
write_cell nombre ${vote_cible[$typevote]}
for (( g = 1; g < ${#groupe_id[@]}; g++ )); do
votes=$(sqlite_request "select
count(député)
from
dépouillements
inner join
députés, groupes
on
députés.groupe = groupes.id and dépouillements.député = députés.id
where
scrutin is $scrutin
and
vote is $typevote
and
groupes.id is ${groupe_id[$g]}")
write_cell nombre $votes
done
done
echo '' >> "$content"
if test $(( ($line * 100) / ${qty:-$last} )) -ne $progress; then
progress=$(( ($line * 100) / ${qty:-$last} ))
if test $(( $progress % ${generation_progress:-5} )) -eq 0; then
now=$(date +%s)
delta=$(( $now - $begin ))
printf "\r%d%%, ETA %s" $progress $(date +%H:%M:%S -d "$(( $delta * (${qty:-$last} - $line) / $line )) seconds")
fi
fi
let line++
done
cat >> "$content" << EOcontent
EOcontent
( cd "/dev/shm/$result" && zip -r ../"$result" * > /dev/null 2>&1 && cd .. && rm -fr "$result" )
mv -f "/dev/shm/$result.zip" "$result.ods"
echo -e "\r\033[KTerminé : $result.ods"
}
function save_database () {
test -n "$result" -a -d "/dev/shm/$result" && rm -fr "/dev/shm/$result"
test -n "$database" -a -n "$in_ram_database" || return
test -r "$in_ram_database" || return
if test -r "$database" && md5sum $in_ram_database | sed "s,$in_ram_database,$database," | md5sum --status -c -; then
rm -f $in_ram_database
elif test -w "$database"; then
mv -f $in_ram_database "$database"
elif ! test -e "$database"; then
mv $in_ram_database "$database"
else
rm -f $in_ram_database
fi
}
function dernier_scrutin_public () {
wget -qO- "http://www2.assemblee-nationale.fr/scrutins/liste/(legislature)/$mandature/(type)/TOUS/(idDossier)/TOUS" \
| sed -rn 's,^.*(.+) | .*$,\1,p' \
| head -1
}
trap save_database EXIT
true_flag=$(mktemp --dry-run XXXXX)
OPTS=$( getopt -l no-db-update,\
db-update-only,\
cible:,\
ref:,\
député:,\
premier-scrutin:,\
dernier-scrutin:,\
période:,\
liste-dossiers,\
liste-députés,\
dossiers,\
dossier:,\
conf:,\
database:,\
progrès-génération:\
progrès-update:,\
help \
-- "$@" )
eval set --$OPTS
while [[ $# -gt 0 ]]; do
case "$1" in
"--no-db-update")
#|ne met pas à jour la base de données
no_db_update=$true_flag;;
"--db-update-only")
#|ne génère pas de fichier de résultat
db_update_only=$true_flag;;
"--cible")
#|génère un comparatif pour ce groupe. Par défaut LREM
groupe[0]="${2^^}"
shift;;
"--ref")
#|compare avec ce ou ces groupes. Si plusieurs groupes, ils sont séparés par une virgule, sans espace. Par défaut GDR
groupe_ref="${2^^}"
shift;;
"--député")
#|filtre la cible sur un-e député-e sur le groupe cible (par défaut LREM). est insensible à la casse. Tout ou partie du nom ou du prénom peut être donné, espace compris. Caractère % utilisé comme caractère joker. Si aucune correspondance n'est trouvée avec un-e député-é, sortie en erreur. Si plusieurs député-e-s correspondent la liste est affichée et sortie en erreur.
depute=$true_flag
nom="$2"
shift;;
"--mandature")
mandature="$2"
;;
"--premier-scrutin")
#|commence la génération du résultat à partir du scrutin
no_db_update=$true_flag
first="$2"
shift;;
"--dernier-scrutin")
#|termine la génération du résultat au scrutin
no_db_update=$true_flag
last="$2"
shift;;
"--période")
#|génère un résultat pour les scrutins allant de jj/mm/aaaa à JJ/MM/AAAA
periode=$true_flag
no_db_update=$true_flag
periode_value="$2"
shift;;
"--liste-députés-du-groupe")
#|liste les député-e-s du groupe sur la mandature
liste_deputes=$true_flag
liste_deputes_value="${2^^}"
shift;;
"--liste-députés")
#|liste tou-te-s les député-e-s de la mandature
liste_deputes=$true_flag;;
"--liste-dossiers")
#|affiche une liste numérotée des dossiers et sort
liste_dossiers=$true_flag;;
"--dossier")
#|génère un résultat pour le dossier numéroté
dossier=$true_flag
dossier_value="$2"
shift;;
"--dossiers")
#|sélection interactive du dossier
dossier=$true_flag;;
"--conf")
#|indique le chemin vers le fichier de configuration. Par défaut "{_}.conf"
test -r "$2" || {
echo "config introuvable $2" >&2
options_error=$true_flag
}
config_file="$2"
shift;;
"--database")
#|indique le chemin vers la base de données SQLite3 contenant les informations. Par défaut "{_}.db"
test -r "$2" && file -b "$2" | grep -q '^SQLite 3.x database' || {
echo "erreur sur option database: fichier '$2' introuvable ou pas une base SQLite 3" >&2
options_error=$true_flag
}
database="$2"
shift;;
"--progrès-génération")
#|affiche de la progression de la génération du fichier tous les %. Par défaut 5
generation_progress="$2"
shift;;
"--progrès-update")
#|affiche de la progression de la mise à jour de la base de données tous les %. Par défaut 1
update_progress="$2"
shift;;
"--help")
#|affiche cette aide et quitte
echo "$0 [options]"
echo "génère un classeur ODS pour comparer les scrutins publics de la 15ème mandature à l'Assemblée Nationale"
echo
sed -rn '/^ *"--.+"\)/N; s/^ *"(--.+)"\)\n#(.+)$/\1|\2/p' "$0" \
| awk -F'|' -v marge=' ' -v prog="$0" '{
printf("%s %s\n" marge "%s\n\n", $1, $2, gensub("\\. ", "\\\n" marge, "g", gensub("\\{_\\}", prog, "g", $3)))
}'
exit;;
esac
shift
done
test "$options_error" = $true_flag && exit 1
test -z "$database" && database="${0}.db"
declare -A groupes
if test -n "$config_file"; then
source "$config_file"
else
config_file="${0}.conf"
if test -r "$config_file"; then
source "$config_file"
fi
fi
IFS=',' groupe=(${groupe[0]:-LREM} ${groupe_ref:-GDR})
in_ram_database=$(mktemp --dry-run /dev/shm/XXXXXXXXXXXX)
if test -r "$database"; then
cp "$database" "$in_ram_database"
else
create_database
fi
for (( g = 0; g < ${#groupe[@]}; g++ )); do
groupe_id[$g]=$(sqlite_request "select id from groupes where nom_court is '${groupe[$g]}'")
if test -z "${groupe_id[$g]}"; then
echo "groupe ${groupe[$g]} inconnu" >&2
exit 1
fi
done
if test "$periode" = $true_flag; then
first=$(sqlite_request "select num from scrutins where date like '% du ${periode_value%:*}' order by num asc" | head -1)
last=$(sqlite_request "select num from scrutins where date like '% du ${periode_value#*:}' order by num asc" | tail -1)
test -z "$first" && echo "date de début inconnue: ${periode_value#*:}" >&2 && rm -f $in_ram_database && exit 1
test -z "$last" && echo "date de fin inconnue: ${periode_value%:*}" >&2 && rm -f $in_ram_database && exit 1
elif test "$dossier" != $true_flag; then
test -z "$last" && last=$(dernier_scrutin_public)
test -z "$first" && first=1
fi
if test "$liste_dossiers" = $true_flag; then
sqlite_request "select printf('%s - %s', id, url) from url" | sed 's,https*://.*/dossiers/,,; s/_/ /g; s/.asp$//'
exit
fi
if test "$db_update_only" = $true_flag; then
unset first last
last=$(dernier_scrutin_public)
update_database
exit
fi
if test "$liste_deputes" = $true_flag; then
if test -n "$liste_deputes_value"; then
sqlite_request "select printf('%s - %s', députés.nom, groupes.nom_court) from députés inner join groupes on groupes.id = députés.groupe where groupes.nom_court is '$liste_deputes_value'"
else
sqlite_request "select printf('%s - %s', députés.nom, groupes.nom_court) from députés inner join groupes on groupes.id = députés.groupe order by groupes.nom_court asc"
fi
exit
fi
if test "$depute" = $true_flag; then
if test -n "$nom"; then
match=$(sqlite_request "select count(députés.id) from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase")
if test $match -ne 1; then
if test $match -eq 0; then
echo "pas de député correspondant dans le groupe $groupe"
else
echo "plusieurs députés correspondent:"
sqlite_request "select députés.nom from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase"
fi
exit 1
else
nom=$(sqlite_request "select députés.id,députés.nom from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase")
groupe[0]="${nom#*|} (${groupe[0]})"
fi
fi
fi
if test "$dossier" = $true_flag; then
last=$(dernier_scrutin_public)
if test -z "$dossier_value"; then
IFS=$'\n'
select dossier in $(sqlite_request "select url from url" | sed 's,^.*/dossiers/,,; s/_/ /g; s/.asp$//'); do
if test -n "$dossier"; then
seq="sqlite_request \"select num from scrutins inner join url on url.id = scrutins.url where url.url like '%/dossiers/${dossier// /_}%' order by num asc\""
qty=$(sqlite_request "select count(num) from scrutins inner join url on url.id = scrutins.url where url.url like '%/dossiers/${dossier// /_}%' order by num asc")
break
fi
done
IFS=$IFS_
else
seq="sqlite_request \"select num from scrutins inner join url on url.id = scrutins.url where url.id is $dossier_value order by num asc\""
qty=$(sqlite_request "select count(num) from scrutins inner join url on url.id = scrutins.url where url.id is $dossier_value order by num asc")
dossier=$(sqlite_request "select url from url where id is $dossier_value" | sed 's,^.*/dossiers/,,; s/_/ /g; s/.asp$//')
fi
fi
update_database
write_comparaison
|