scripts / analyse-votes-AN /
Newer Older
574 lines | 28.163kb
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
1
#!/bin/bash
2

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
3
for tool in sqlite3 getopt md5sum mktemp; do
4
    which $tool > /dev/null 2>&1 || {
5
        echo missing tool $tool
6
        exit 1
7
    }
plus de souplesse dans les p...
Sébastien MARQUE authored on 2019-02-20
8
done
9

            
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
10
IFS_=$IFS
11

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
12
function create_database () {
13
    declare -A groupes
14
    if test -z "${groupes[@]}"; then
15
        echo "unable to find groupes in $config_file" >&2
16
        exit 1
fixe pb quand groupe cible e...
Sébastien Marque authored on 2019-02-18
17
    fi
complète re-écriture
Sébastien Marque authored on 2019-04-27
18

            
19
    sqlite3 "$in_ram_database" <<< "create table if not exists votes (id integer primary key, nom text)"
20
    sqlite3 "$in_ram_database" <<< "create table if not exists url (id integer primary key autoincrement, url text)"
21
    sqlite3 "$in_ram_database" <<< "create table if not exists députés (id integer primary key autoincrement, nom text, groupe integer)"
22
    sqlite3 "$in_ram_database" <<< "create table if not exists groupes (id integer primary key autoincrement, nom text, nom_court text)"
23
    sqlite3 "$in_ram_database" <<< "create table if not exists scrutins (num integer primary key, date text not null, intitulé text non null, adoption boolean, url integer)"
24
    sqlite3 "$in_ram_database" <<< "create table if not exists dépouillement (député integer not null, scrutin integer not null, groupe integer not null, vote integer not null)"
25

            
26
    v_id=0
27
    for v in Pour Contre Abstention Non-votant; do
28
        if test -z $(sqlite3 "$in_ram_database" <<< "select nom from votes where id is $v_id"); then
29
            sqlite3 "$in_ram_database" <<< "insert into votes values ($v_id, '$v')"
30
        else
31
            test -z $(sqlite3 "$in_ram_database" <<< "select nom from votes where id is $v_id and nom is '$v'") \
32
                && sqlite3 "$in_ram_database" <<< "update votes set nom = '$v' where id is $v_id)"
33
        fi
34
        let v_id++
35
    done
36
    unset v_id v
37

            
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
38
    for g in ${!groupes[@]}; do
complète re-écriture
Sébastien Marque authored on 2019-04-27
39
        test -z $(sqlite3 "$in_ram_database" <<< "select id from groupes where nom is '${groupes[$g]}' and nom_court is '$g'") \
40
            && sqlite3 "$in_ram_database" <<< "insert into groupes (nom, nom_court) values ('${groupes[$g]}', '$g')"
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
41
    done
complète re-écriture
Sébastien Marque authored on 2019-04-27
42
    unset g groupes
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
43

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
44
    test -z $(sqlite3 "$in_ram_database" <<< "select id from url where id = 0") \
45
        && sqlite3 "$in_ram_database" <<< "insert into url values (0, '')"
46
}
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
47

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
48
function update_database () {
49
    test "$no_db_update" = $true_flag && return
50
    tempfile="/dev/shm/scrutin.$$"
51
    progress=0
fix bug sur premier scrutin
Sébastien Marque authored on 2019-04-27
52
    first_=$first
53
    first=$(sqlite3 "$in_ram_database" <<< "select count(num) from scrutins")
complète re-écriture
Sébastien Marque authored on 2019-04-27
54
    if test ${first:-0} -lt $last; then
55
        echo "récupération des scrutins n°$((${first:-0}+1)) à n°$last dans "$database" (à conserver autant que possible)" >&2
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
56

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
57
        url_database=/dev/shm/url_database
58
        : > "$url_database"
59
        test $((last % 100)) -ne 0 && last_offset=0
60
        for offset in $(seq $((last - 100)) -100 ${first:-0} ) $last_offset; do
61
            wget -qO- "http://www2.assemblee-nationale.fr/scrutins/liste/(offset)/$offset/(legislature)/15/(type)/TOUS/(idDossier)/TOUS" \
62
                | awk '
63
                    /<td class="denom">/ {
64
                        scrutin = gensub(/^.+denom.>([[:digit:]]+).*<.td./,"\\1","1",$0)
65
                    }
66
                    /<td class="desc">.+dossier<.a/ {
67
                        a[scrutin] = gensub(/^.+.<a href="(.+)">dossier<.a>.*$/,"\\1","1",$0)
68
                    }
69
                    END {
70
                        for (i in a)
71
                            print gensub("*","","1",i) "|" a[i]
72
                    }' >> "$url_database"
73
        done
74
        sort -u "$url_database" > "${url_database}.sorted"
75
        mv -f "${url_database}.sorted" "$url_database"
76

            
77
        IFS=$'\n'
78
        begin=$(date +%s)
79
        for scrutin in $(seq $((${first:-0}+1)) $last); do
80
            wget -qO- "http://www2.assemblee-nationale.fr/scrutins/detail/(legislature)/15/(num)/$scrutin" \
81
                |  sed -r '0,/< *div class="titre-bandeau-bleu +to-print" *>/d; /< *script +type="text\/javascript" *>/,$d' > $tempfile
82

            
83
            unset title date adoption url id_url
84

            
85
            title=$(sed -rn '/<h1 class="">Analyse du scrutin n° '$scrutin'/n; s,^.*<h3 class="president-title">(.+).</h3>,\1,p' $tempfile \
86
                    | sed "s/;//g; s/[ \t][ \t]+/ /g; s/^Scrutin public sur *//; s/^l[ae']s* *//")
87
            date=$(sed -rn 's,^.*<h1 class="">Analyse du scrutin n° '$scrutin'<br/>(.+) </h1>,\1,p' $tempfile)
88
            adoption=$(sed -rn 's,^.*<p class="annonce"><span class="annoncevote">(.+).</span></p>.*$,\1,p' $tempfile)
89
            test -n "$title" -a -n "$date" -a -n "$adoption" || {
90
                echo "erreur dans la récupération du scrutin $scrutin"
91
                exit 1
92
            }
93
            grep -q 'e a a' <<< "$adoption" && adoption=1 || adoption=0
petite simplification du cod...
Sébastien MARQUE authored on 2019-03-31
94

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
95
            url=$(awk -F'|' "/^$scrutin\|/{print \$2}" "$url_database")
96
            id_url=$(sqlite3 "$in_ram_database" <<< "select id from url where url is '$url'")
97
            if test -z "$id_url"; then
98
                sqlite3 "$in_ram_database" <<< "insert into url (url) values ('$url')"
99
                id_url=$(sqlite3 "$in_ram_database" <<< "select id from url where url is '$url'")
100
            fi
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
101

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
102
            sqlite3 "$in_ram_database" <<< "insert into scrutins values ($scrutin, '$date', \"${title//\"}\", $adoption, ${id_url:-0})"
103

            
104
            for v in $(sqlite3 "$in_ram_database" <<< "select * from votes"); do
105
                for g in $(sqlite3 "$in_ram_database" <<< "select id,nom from groupes"); do
106
                    for d in $(sed -rn '/<p class="nomgroupe">'${g#*|}' <span class="block topmargin">/,/<div class="TTgroupe topmargin-lg">/p' $tempfile \
107
                        | sed -rn '/<p class="typevote">'${v#*|}':/,/<.div>/p' \
108
                        | sed 's,</li>,\n,g' \
109
                        | sed -rn '/<p class="typevote">/d; s,^\s*<li>\s*,,; s,&nbsp;, ,g; s/^\s*//; s/M(me|\.) //; s/ \(.*$//; s,<b>,,; s,</b>,,p'); do
110
                        d_id=$(sqlite3 "$in_ram_database" <<< "select id from députés where nom is \"$d\" and groupe is ${g%|*}")
111
                        if test -z "$d_id"; then
112
                            sqlite3 "$in_ram_database" <<< "insert into députés (nom, groupe) values (\"$d\", ${g%|*})"
113
                            d_id=$(sqlite3 "$in_ram_database" <<< "select id from députés where nom is \"$d\" and groupe is ${g%|*}")
114
                        fi
115
                        sqlite3 "$in_ram_database" <<< "insert into dépouillement values ($d_id, $scrutin, ${g%|*}, ${v%|*})"
116
                    done
117
                done
118
            done
119

            
120
            if test $((($scrutin*100)/$last)) -ne $progress; then
121
                progress=$((($scrutin*100)/$last))
122
                if test $(($progress % ${update_progress:-1})) -eq 0; then
123
                    now=$(date +%s)
124
                    delta=$(( $now - $begin ))
125
                    echo $progress%, ETA: $(date +%H:%M:%S -d "$(($delta * ($last - $scrutin) / $scrutin)) seconds")
126
                fi
127
            fi
128
        done
129
        rm -f "$url_database" "$tempfile"
130
    fi
fix bug sur premier scrutin
Sébastien Marque authored on 2019-04-27
131
    first=$first_
complète re-écriture
Sébastien Marque authored on 2019-04-27
132
}
133

            
134
function write_comparaison () {
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
135
    result="comparaisons ${groupe[0]} avec ${groupe_ref:-GDR}${dossier:+ - ${dossier}}"
complète re-écriture
Sébastien Marque authored on 2019-04-27
136
    content="/dev/shm/$result/content.xml"
137
    id_cols="Scrutin Date Titre Adoption"
138
    typevotes=$(sqlite3 "$in_ram_database" <<< "select nom from votes")
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
139
    nb_cols=$(( $(wc -w <<< $id_cols) + $(wc -w <<< $typevotes) * ${#groupe[@]} ))
140
    last_col=$(awk -v n=$nb_cols 'BEGIN{printf("%c%c", n < 27 ? "" : int(n/26) + 64, (n % 26) + (n % 26 == 0 ? 26 : 0) + 64)}' | tr -d '\0')
complète re-écriture
Sébastien Marque authored on 2019-04-27
141

            
142
    echo "génération du fichier $result"
143

            
144
    mkdir -p "/dev/shm/$result/META-INF"
145

            
146
    cat > "/dev/shm/$result/META-INF/manifest.xml" << EOmetainf
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
147
<?xml version="1.0" encoding="UTF-8"?>
148
<manifest:manifest xmlns:manifest="urn:oasis:names:tc:opendocument:xmlns:manifest:1.0" manifest:version="1.2">
149
 <manifest:file-entry manifest:full-path="/" manifest:version="1.2" manifest:media-type="application/vnd.oasis.opendocument.spreadsheet"/>
150
 <manifest:file-entry manifest:full-path="content.xml" manifest:media-type="text/xml"/>
151
</manifest:manifest>
152
EOmetainf
153

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
154
    printf 'application/vnd.oasis.opendocument.spreadsheet' > "/dev/shm/$result/mimetype"
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
155

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
156
    echo '<?xml version="1.0" encoding="UTF-8"?>' > "$content"
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
157

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
158
    cat >> "$content" << EOcontent
159
    <office:document-content xmlns:office="urn:oasis:names:tc:opendocument:xmlns:office:1.0" xmlns:style="urn:oasis:names:tc:opendocument:xmlns:style:1.0" xmlns:text="urn:oasis:names:tc:opendocument:xmlns:text:1.0" xmlns:table="urn:oasis:names:tc:opendocument:xmlns:table:1.0" xmlns:draw="urn:oasis:names:tc:opendocument:xmlns:drawing:1.0" xmlns:fo="urn:oasis:names:tc:opendocument:xmlns:xsl-fo-compatible:1.0" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:meta="urn:oasis:names:tc:opendocument:xmlns:meta:1.0" xmlns:number="urn:oasis:names:tc:opendocument:xmlns:datastyle:1.0" xmlns:presentation="urn:oasis:names:tc:opendocument:xmlns:presentation:1.0" xmlns:svg="urn:oasis:names:tc:opendocument:xmlns:svg-compatible:1.0" xmlns:chart="urn:oasis:names:tc:opendocument:xmlns:chart:1.0" xmlns:dr3d="urn:oasis:names:tc:opendocument:xmlns:dr3d:1.0" xmlns:math="http://www.w3.org/1998/Math/MathML" xmlns:form="urn:oasis:names:tc:opendocument:xmlns:form:1.0" xmlns:script="urn:oasis:names:tc:opendocument:xmlns:script:1.0" xmlns:ooo="http://openoffice.org/2004/office" xmlns:ooow="http://openoffice.org/2004/writer" xmlns:oooc="http://openoffice.org/2004/calc" xmlns:dom="http://www.w3.org/2001/xml-events" xmlns:xforms="http://www.w3.org/2002/xforms" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:rpt="http://openoffice.org/2005/report" xmlns:of="urn:oasis:names:tc:opendocument:xmlns:of:1.2" xmlns:xhtml="http://www.w3.org/1999/xhtml" xmlns:grddl="http://www.w3.org/2003/g/data-view#" xmlns:tableooo="http://openoffice.org/2009/table" xmlns:drawooo="http://openoffice.org/2010/draw" xmlns:calcext="urn:org:documentfoundation:names:experimental:calc:xmlns:calcext:1.0" xmlns:loext="urn:org:documentfoundation:names:experimental:office:xmlns:loext:1.0" xmlns:field="urn:openoffice:names:experimental:ooo-ms-interop:xmlns:field:1.0" xmlns:formx="urn:openoffice:names:experimental:ooxml-odf-interop:xmlns:form:1.0" xmlns:css3t="http://www.w3.org/TR/css3-text/" office:version="1.2">
160
    <office:scripts/>
161
    <office:font-face-decls>
162
    <style:font-face style:name="Liberation Sans" svg:font-family="&apos;Liberation Sans&apos;" style:font-family-generic="swiss" style:font-pitch="variable"/>
163
    <style:font-face style:name="DejaVu Sans" svg:font-family="&apos;DejaVu Sans&apos;" style:font-family-generic="system" style:font-pitch="variable"/>
164
    <style:font-face style:name="FreeSans" svg:font-family="FreeSans" style:font-family-generic="system" style:font-pitch="variable"/>
165
    </office:font-face-decls>
166
    <office:automatic-styles>
167
EOcontent
168

            
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
169
    IFS=$'\n'
complète re-écriture
Sébastien Marque authored on 2019-04-27
170
    for i in $(seq $nb_cols); do
171
        cat >> "$content" << EOcontent
172
            <style:style style:name="co$i" style:family="table-column">
173
            <style:table-column-properties fo:break-before="auto" style:column-width="30.00mm"/>
174
            </style:style>
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
175
EOcontent
complète re-écriture
Sébastien Marque authored on 2019-04-27
176
    done
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
177

            
178
    cat >> "$content" << EOcontent
complète re-écriture
Sébastien Marque authored on 2019-04-27
179
    <style:style style:name="ro1" style:family="table-row">
180
    <style:table-row-properties style:row-height="4.52mm" fo:break-before="auto" style:use-optimal-row-height="true"/>
181
    </style:style>
182
    <style:style style:name="ta1" style:family="table" style:master-page-name="Default">
183
    <style:table-properties table:display="true" style:writing-mode="lr-tb"/>
184
    </style:style>
185
    <style:style style:name="ce1" style:family="table-cell" style:parent-style-name="Default">
186
    <style:table-cell-properties fo:background-color="#cccccc"/>
187
    </style:style>
188
    </office:automatic-styles>
189
    <office:body>
190
    <office:spreadsheet>
191
    <table:calculation-settings table:automatic-find-labels="false"/>
192
    <table:table table:name="$result" table:style-name="ta1">
193
    <office:forms form:automatic-focus="false" form:apply-design-mode="false"/>
194
    <table:table-column table:style-name="co1" table:number-columns-repeated="$(wc -w <<< $id_cols)" table:default-cell-style-name="Default"/>
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
195
EOcontent
196

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
197
    for i in $(seq $(wc -w <<< $typevotes)); do
198
        cat >> "$content" << EOcontent
199
        <table:table-column table:style-name="co1" table:default-cell-style-name="ce1"/>
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
200
EOcontent
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
201
        for (( g = 1; g < ${#groupe[@]}; g++ )); do
202
            cat >> "$content" << EOcontent
203
            <table:table-column table:style-name="co1" table:default-cell-style-name="Default"/>
204
EOcontent
205
        done
complète re-écriture
Sébastien Marque authored on 2019-04-27
206
    done
207
    echo '<table:table-row table:style-name="ro1">' >> "$content"
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
208

            
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
209
    IFS=$IFS_
complète re-écriture
Sébastien Marque authored on 2019-04-27
210
    for colonne in $id_cols; do
211
        cat >> "$content" << EOcontent
212
            <table:table-cell office:value-type="string" calcext:value-type="string">
213
            <text:p>$colonne</text:p>
214
            </table:table-cell>
215
EOcontent
216
    done
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
217

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
218
    for typevote in $typevotes; do
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
219
        for g in "${groupe[@]}"; do
complète re-écriture
Sébastien Marque authored on 2019-04-27
220
            cat >> "$content" << EOcontent
221
                <table:table-cell office:value-type="string" calcext:value-type="string">
222
                <text:p>$typevote - $g</text:p>
223
                </table:table-cell>
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
224
EOcontent
complète re-écriture
Sébastien Marque authored on 2019-04-27
225
        done
226
    done
227

            
228
    echo '</table:table-row>' >> "$content"
229

            
230
    progress=0
231
    begin=$(date +%s)
232
    line=1
améliore progression
Sébastien Marque authored on 2019-05-03
233
    test -z "$seq" && qty=$(( $last - $first ))
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
234
    IFS=$'\n'
complète re-écriture
Sébastien Marque authored on 2019-04-27
235
    for scrutin in $(eval ${seq:-seq $first $last}); do
236

            
237
        data=$(sqlite3 "$in_ram_database" <<< "select date,intitulé,adoption,url.url from scrutins inner join url on scrutins.url = url.id where num is $scrutin")
238
        date=$(cut -d'|' -sf 1 <<< $data)
239
        title=$(cut -d'|' -sf 2 <<< $data)
240
        adoption=$(cut -d'|' -sf 3 <<< $data)
241
        url=$(cut -d'|' -sf 4 <<< $data)
242
        test $adoption -eq 1 && adoption='oui' || adoption='non'
groupe de référence: GDR
Sébastien MARQUE authored on 2019-02-17
243

            
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
244
        cat >> "$content" << EOcontent
complète re-écriture
Sébastien Marque authored on 2019-04-27
245
            <table:table-row table:style-name="ro1">
246
EOcontent
247
        if test -n "$url"; then
248
            cat >> "$content" << EOcontent
249
                <table:table-cell office:value-type="string" calcext:value-type="string">
250
                <text:p><text:a xlink:href="$url" xlink:type="simple">$scrutin</text:a></text:p>
251
                </table:table-cell>
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
252
EOcontent
complète re-écriture
Sébastien Marque authored on 2019-04-27
253
        else
254
            cat >> "$content" << EOcontent
255
                <table:table-cell office:value-type="float" office:value="$scrutin" calcext:value-type="float">
256
                <text:p>$scrutin</text:p>
257
                </table:table-cell>
258
EOcontent
259
        fi
260
        cat >> "$content" << EOcontent
261
            <table:table-cell office:value-type="string" calcext:value-type="string">
262
            <text:p>$date</text:p>
263
            </table:table-cell>
264
            <table:table-cell office:value-type="string" calcext:value-type="string">
265
            <text:p>${title//\'/&apos;}</text:p>
266
            </table:table-cell>
267
            <table:table-cell office:value-type="string" calcext:value-type="string">
268
            <text:p>${adoption}</text:p>
269
            </table:table-cell>
270
EOcontent
271
        for typevote in 0 1 2 3; do
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
272
            votes=$(sqlite3 "$in_ram_database" <<< "select
complète re-écriture
Sébastien Marque authored on 2019-04-27
273
                                        count(député)
274
                                     from
275
                                        dépouillement
276
                                     where
277
                                        scrutin is $scrutin
278
                                     and
279
                                        vote is $typevote
280
                                     and
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
281
                                        groupe is ${groupe_id[0]} ${nom:+ and député is ${nom%|*}}")
complète re-écriture
Sébastien Marque authored on 2019-04-27
282
            cat >> "$content" << EOcontent
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
283
                <table:table-cell office:value-type="float" office:value="$votes" calcext:value-type="float">
284
                <text:p>$votes</text:p>
complète re-écriture
Sébastien Marque authored on 2019-04-27
285
                </table:table-cell>
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
286
EOcontent
287
            for (( g = 1; g < ${#groupe_id[@]}; g++ )); do
288
                votes=$(sqlite3 "$in_ram_database" <<< "select
289
                                            count(député)
290
                                         from
291
                                            dépouillement
292
                                         where
293
                                            scrutin is $scrutin
294
                                         and
295
                                            vote is $typevote
296
                                         and
297
                                            groupe is ${groupe_id[$g]}")
298
                cat >> "$content" << EOcontent
299
                    <table:table-cell office:value-type="float" office:value="$votes" calcext:value-type="float">
300
                    <text:p>$votes</text:p>
301
                    </table:table-cell>
complète re-écriture
Sébastien Marque authored on 2019-04-27
302
EOcontent
303
            done
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
304
        done
complète re-écriture
Sébastien Marque authored on 2019-04-27
305
        echo '</table:table-row>' >> "$content"
306

            
meilleur calcul progression
Sébastien Marque authored on 2019-04-27
307
        if test $(( ($line * 100) / ${qty:-$last} )) -ne $progress; then
308
            progress=$(( ($line * 100) / ${qty:-$last} ))
309
            if test $(( $progress % ${generation_progress:-5} )) -eq 0; then
complète re-écriture
Sébastien Marque authored on 2019-04-27
310
                now=$(date +%s)
311
                delta=$(( $now - $begin ))
meilleur calcul progression
Sébastien Marque authored on 2019-04-27
312
                echo $progress%, ETA: $(date +%H:%M:%S -d "$(( $delta * (${qty:-$last} - $line) / $line )) seconds")
complète re-écriture
Sébastien Marque authored on 2019-04-27
313
            fi
314
        fi
meilleur calcul progression
Sébastien Marque authored on 2019-04-27
315

            
316
        let line++
317

            
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
318
    done
complète re-écriture
Sébastien Marque authored on 2019-04-27
319
    echo
320

            
321
    cat >> "$content" << EOcontent
322
    </table:table>
323
    <table:named-expressions/>
324
    <table:database-ranges>
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
325
    <table:database-range table:name="__Anonymous_Sheet_DB__0" table:target-range-address="&apos;$result&apos;.D1:&apos;$result&apos;.$last_col$line" table:display-filter-buttons="true"/>
complète re-écriture
Sébastien Marque authored on 2019-04-27
326
    </table:database-ranges>
327
    </office:spreadsheet>
328
    </office:body>
329
    </office:document-content>
330
EOcontent
331

            
332
    ( cd "/dev/shm/$result" && zip -r ../"$result" * > /dev/null 2>&1 && cd .. && rm -fr "$result" )
333

            
334
    mv -f "/dev/shm/$result.zip" "$result.ods"
335

            
336
    echo "$result.ods"
337
}
338

            
339
function save_database () {
améliore le trap
Sébastien Marque authored on 2019-04-27
340
    test -n "$database" -a -n "$in_ram_database" || return
complète re-écriture
Sébastien Marque authored on 2019-04-27
341
    if test -r "$database" && md5sum $in_ram_database | sed "s,$in_ram_database,$database," | md5sum --status -c -; then
342
        rm -f $in_ram_database
343
    elif test -w "$database"; then
344
        mv -f $in_ram_database "$database"
345
    elif ! test -e "$database"; then
346
        mv $in_ram_database "$database"
347
    else
348
        rm -f $in_ram_database
349
    fi
350
}
351

            
352
trap save_database EXIT
353

            
354
true_flag=$(mktemp --dry-run XXXXX)
355

            
356
OPTS=$( getopt -l no-db-update,\
357
                  db-update-only,\
358
                  cible:,\
359
                  ref:,\
360
                  député:,\
361
                  premier-scrutin:,\
362
                  dernier-scrutin:,\
363
                  période:,\
364
                  liste-dossiers,\
365
                  liste-députés,\
366
                  dossiers,\
367
                  dossier:,\
368
                  conf:,\
369
                  database:,\
370
                  progrès-génération:\
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
371
                  progrès-update:,\
372
                  help \
complète re-écriture
Sébastien Marque authored on 2019-04-27
373
                  -- "$@" )
374

            
375
eval set --$OPTS
376

            
377
while [[ $# -gt 0 ]]; do
378
    case "$1" in
379
        "--no-db-update")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
380
#|ne met pas à jour la base de données
complète re-écriture
Sébastien Marque authored on 2019-04-27
381
            no_db_update=$true_flag;;
382
        "--db-update-only")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
383
#|ne génère pas de fichier de résultat
complète re-écriture
Sébastien Marque authored on 2019-04-27
384
            db_update_only=$true_flag;;
385
        "--cible")
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
386
#<nom court du groupe>|génère un comparatif pour ce groupe. Par défaut LREM
387
            groupe[0]="${2^^}"
complète re-écriture
Sébastien Marque authored on 2019-04-27
388
            shift;;
389
        "--ref")
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
390
#<nom court du groupe ou des groupes>|compare avec ce ou ces groupes. Si plusieurs groupes, ils sont séparés par une virgule, sans espace. Par défaut GDR
fix typo
Sébastien Marque authored on 2019-04-27
391
            groupe_ref="${2^^}"
complète re-écriture
Sébastien Marque authored on 2019-04-27
392
            shift;;
393
        "--député")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
394
#<nom>|filtre la cible sur un-e député-e sur le groupe cible (par défaut LREM). <nom> est insensible à la casse. Tout ou partie du nom ou du prénom peut être donné, espace compris. Caractère % utilisé comme caractère joker. Si aucune correspondance n'est trouvée avec un-e député-é, sortie en erreur. Si plusieurs député-e-s correspondent la liste est affichée et sortie en erreur.
complète re-écriture
Sébastien Marque authored on 2019-04-27
395
            depute=$true_flag
396
            nom="$2"
397
            shift;;
398
        "--premier-scrutin")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
399
#<numéro>|commence la génération du résultat à partir du scrutin <numéro>
complète re-écriture
Sébastien Marque authored on 2019-04-27
400
            no_db_update=$true_flag
401
            first="$2"
402
            shift;;
403
        "--dernier-scrutin")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
404
#<numéro>|termine la génération du résultat au scrutin <numéro>
complète re-écriture
Sébastien Marque authored on 2019-04-27
405
            no_db_update=$true_flag
406
            last="$2"
407
            shift;;
408
        "--période")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
409
#<jj/mm/aaaa:JJ/MM/AAAA>|génère un résultat pour les scrutins allant de jj/mm/aaaa à JJ/MM/AAAA
complète re-écriture
Sébastien Marque authored on 2019-04-27
410
            periode=$true_flag
411
            no_db_update=$true_flag
412
            periode_value="$2"
413
            shift;;
414
        "--liste-députés-du-groupe")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
415
#<nom court du groupe>|liste les député-e-s du groupe <nom court du groupe> sur la mandature
complète re-écriture
Sébastien Marque authored on 2019-04-27
416
            liste_deputes=$true_flag
417
            liste_deputes_value="${2^^}"
418
            shift;;
419
        "--liste-députés")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
420
#|liste tou-te-s les député-e-s de la mandature
complète re-écriture
Sébastien Marque authored on 2019-04-27
421
            liste_deputes=$true_flag;;
422
        "--liste-dossiers")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
423
#|affiche une liste numérotée des dossiers et sort
complète re-écriture
Sébastien Marque authored on 2019-04-27
424
            liste_dossiers=$true_flag;;
425
        "--dossier")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
426
#<numéro>|génère un résultat pour le dossier numéroté <numéro>
complète re-écriture
Sébastien Marque authored on 2019-04-27
427
            dossier=$true_flag
428
            dossier_value="$2"
429
            shift;;
430
        "--dossiers")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
431
#|sélection interactive du dossier
complète re-écriture
Sébastien Marque authored on 2019-04-27
432
            dossier=$true_flag;;
433
        "--conf")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
434
#<fichier>|indique le chemin vers le fichier de configuration. Par défaut "{_}.conf"
complète re-écriture
Sébastien Marque authored on 2019-04-27
435
            test -r "$2" || {
436
                echo "config introuvable $2" >&2
437
                options_error=$true_flag
438
            }
439
            config_file="$2"
440
            shift;;
441
        "--database")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
442
#<fichier>|indique le chemin vers la base de données SQLite3 contenant les informations. Par défaut "{_}.db"
complète re-écriture
Sébastien Marque authored on 2019-04-27
443
            test -r "$2" && file -b "$2" | grep -q '^SQLite 3.x database' || {
444
                echo "erreur sur option database: fichier '$2' introuvable ou pas une base SQLite 3" >&2
445
                options_error=$true_flag
446
            }
447
            database="$2"
448
            shift;;
449
        "--progrès-génération")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
450
#<chiffre>|affiche de la progression de la génération du fichier tous les <chiffre>%. Par défaut 5
complète re-écriture
Sébastien Marque authored on 2019-04-27
451
            generation_progress="$2"
452
            shift;;
453
        "--progrès-update")
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
454
#<chiffre>|affiche de la progression de la mise à jour de la base de données tous les <chiffre>%. Par défaut 1
complète re-écriture
Sébastien Marque authored on 2019-04-27
455
            update_progress="$2"
456
            shift;;
ajout d'un message d'aide
Sébastien Marque authored on 2019-04-27
457
        "--help")
458
#|affiche cette aide et quitte
459
            echo "$0 [options]"
460
            echo "génère un classeur ODS pour comparer les scrutins publics de la 15ème mandature à l'Assemblée Nationale"
461
            echo
462
            sed -rn '/^ *"--.+"\)/N; s/^ *"(--.+)"\)\n#(.+)$/\1|\2/p' "$0" \
463
                | awk -F'|' -v marge='  ' -v prog="$0" '{
464
                    printf("%s %s\n" marge "%s\n\n", $1, $2, gensub("\\. ", "\\\n" marge, "g", gensub("\\{_\\}", prog, "g", $3)))
465
                }'
466
            exit;;
complète re-écriture
Sébastien Marque authored on 2019-04-27
467
    esac
468
    shift
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
469
done
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
470

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
471
test "$options_error" = $true_flag && exit 1
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
472

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
473
test -z "$database" && database="${0}.db"
utilsation d'une archive com...
Sébastien MARQUE authored on 2019-02-20
474

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
475
if test -n "$config_file"; then
476
    source "$config_file"
477
else
478
    config_file="${0}.conf"
479
    if test -r "$config_file"; then
480
        source "$config_file"
481
    fi
utilsation d'une archive com...
Sébastien MARQUE authored on 2019-02-20
482
fi
483

            
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
484
IFS=',' groupe=(${groupe[0]:-LREM} ${groupe_ref:-GDR})
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
485

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
486
in_ram_database=$(mktemp --dry-run /dev/shm/XXXXXXXXXXXX)
487
if test -r "$database"; then
488
    cp "$database" "$in_ram_database"
489
else
490
    create_database
491
fi
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
492

            
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
493
for (( g = 0; g < ${#groupe[@]}; g++ )); do
494
    groupe_id[$g]=$(sqlite3 "$in_ram_database" <<< "select id from groupes where nom_court is '${groupe[$g]}'")
495
    if test -z "${groupe_id[$g]}"; then
496
        echo "groupe ${groupe[$g]} inconnu" >&2
complète re-écriture
Sébastien Marque authored on 2019-04-27
497
        exit 1
498
    fi
499
done
ajout script d'analyse des v...
Sébastien MARQUE authored on 2019-02-17
500

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
501
if test "$periode" = $true_flag; then
502
    first=$(sqlite3 "$in_ram_database" <<< "select num from scrutins where date like '% du ${periode_value%:*}' order by num asc" | head -1)
503
    last=$(sqlite3 "$in_ram_database" <<< "select num from scrutins where date like '% du ${periode_value#*:}' order by num asc" | tail -1)
504
    test -z "$first" && echo "date de début inconnue: ${periode_value#*:}" >&2 && rm -f $in_ram_database && exit 1
505
    test -z "$last" && echo "date de fin inconnue: ${periode_value%:*}" >&2 && rm -f $in_ram_database && exit 1
fix bug sur premier scrutin
Sébastien Marque authored on 2019-04-27
506
elif test "$dossier" != $true_flag; then
complète re-écriture
Sébastien Marque authored on 2019-04-27
507
    test -z "$last" && last=$(wget -qO- 'http://www2.assemblee-nationale.fr/scrutins/liste/(legislature)/15/(type)/TOUS/(idDossier)/TOUS' \
508
            | sed -rn 's,^.*<td class="denom">(.+)</td>.*$,\1,p' \
509
            | head -1)
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
510

            
fix bug sur premier scrutin
Sébastien Marque authored on 2019-04-27
511
    test -z "$first" && first=1
complète re-écriture
Sébastien Marque authored on 2019-04-27
512
fi
affiche nom du fichier des r...
Sébastien MARQUE authored on 2019-03-30
513

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
514
if test "$liste_dossiers" = $true_flag; then
515
    sqlite3 "$in_ram_database" <<< "select printf('%s - %s', id, url) from url" | sed 's,https*://.*/dossiers/,,; s/_/ /g; s/.asp$//'
516
    exit
517
fi
518

            
519
if test "$db_update_only" = $true_flag; then
520
    unset first last
fix dernier scrutin pour upd...
Sébastien Marque authored on 2019-05-30
521
    last=$(wget -qO- 'http://www2.assemblee-nationale.fr/scrutins/liste/(legislature)/15/(type)/TOUS/(idDossier)/TOUS' \
522
            | sed -rn 's,^.*<td class="denom">(.+)</td>.*$,\1,p' \
523
            | head -1)
complète re-écriture
Sébastien Marque authored on 2019-04-27
524
    update_database
525
    exit
526
fi
527

            
528
if test "$liste_deputes" = $true_flag; then
529
    if test -n "$liste_deputes_value"; then
fix erreur de syntaxe
Sébastien Marque authored on 2019-04-27
530
        sqlite3 "$in_ram_database" <<< "select printf('%s - %s', députés.nom, groupes.nom_court) from députés inner join groupes on groupes.id = députés.groupe where groupes.nom_court is '$liste_deputes_value'"
complète re-écriture
Sébastien Marque authored on 2019-04-27
531
    else
fix erreur de syntaxe
Sébastien Marque authored on 2019-04-27
532
        sqlite3 "$in_ram_database" <<< "select printf('%s - %s', députés.nom, groupes.nom_court) from députés inner join groupes on groupes.id = députés.groupe order by groupes.nom_court asc"
complète re-écriture
Sébastien Marque authored on 2019-04-27
533
    fi
534
    exit
535
fi
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
536

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
537
if test "$depute" = $true_flag; then
538
    if test -n "$nom"; then
539
        match=$(sqlite3 "$in_ram_database" <<< "select count(députés.id) from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase")
540
        if test $match -ne 1; then
541
            if test $match -eq 0; then
542
                echo "pas de député correspondant dans le groupe $groupe"
543
            else 
544
                echo "plusieurs députés correspondent:"
545
                sqlite3 "$in_ram_database" <<< "select députés.nom from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase"
546
            fi
547
            exit 1
548
        else
549
            nom=$(sqlite3 "$in_ram_database" <<< "select députés.id,députés.nom from députés inner join groupes on groupes.id = députés.groupe where députés.nom like '%$nom%' and groupes.nom_court is '$groupe' collate nocase")
ajout possibilité de compare...
Sébastien Marque authored on 2019-05-03
550
            groupe[0]="${nom#*|} (${groupe[0]})"
complète re-écriture
Sébastien Marque authored on 2019-04-27
551
        fi
552
    fi
553
fi
554

            
555
if test "$dossier" = $true_flag; then
556
    if test -z "$dossier_value"; then
557
        IFS=$'\n'
558
        select dossier in $(sqlite3 "$in_ram_database" <<< "select url from url" | sed 's,^.*/dossiers/,,; s/_/ /g; s/.asp$//'); do
559
            if test -n "$dossier"; then
560
                seq="sqlite3 \"$in_ram_database\" <<< \"select num from scrutins inner join url on url.id = scrutins.url where url.url like '%/dossiers/${dossier// /_}%' order by num asc\""
meilleur calcul progression
Sébastien Marque authored on 2019-04-27
561
                qty=$(sqlite3 "$in_ram_database" <<< "select count(num) from scrutins inner join url on url.id = scrutins.url where url.url like '%/dossiers/${dossier// /_}%' order by num asc")
complète re-écriture
Sébastien Marque authored on 2019-04-27
562
                break
563
            fi
564
        done
565
        IFS=$IFS_
566
    else
567
        seq="sqlite3 \"$in_ram_database\" <<< \"select num from scrutins inner join url on url.id = scrutins.url where url.id is $dossier_value order by num asc\""
meilleur calcul progression
Sébastien Marque authored on 2019-04-27
568
        qty=$(sqlite3 "$in_ram_database" <<< "select count(num) from scrutins inner join url on url.id = scrutins.url where url.id is $dossier_value order by num asc")
complète re-écriture
Sébastien Marque authored on 2019-04-27
569
        dossier=$(sqlite3 "$in_ram_database" <<< "select url from url where id is $dossier_value" | sed 's,^.*/dossiers/,,; s/_/ /g; s/.asp$//')
570
    fi
571
fi
écriture directe en feuille ...
Sébastien MARQUE authored on 2019-03-31
572

            
complète re-écriture
Sébastien Marque authored on 2019-04-27
573
update_database
574
write_comparaison