SadServersの問題の解説です。 URLは、https://sadservers.com/newserver/saskatoon
“Saskatoon”: counting IPs.
Level: Easy
Description: There’s a web server access log file at /home/admin/access.log. The file consists of one line per HTTP request, with the requester’s IP address at the beginning of each line.
Find what’s the IP address that has the most requests in this file (there’s no tie; the IP is unique). Write the solution into a file /home/admin/highestip.txt. For example, if your solution is “1.2.3.4”, you can do echo “1.2.3.4” > /home/admin/highestip.txt
Webサーバーのアクセスログファイルは、/home/admin/access.logにあります。このファイルは、HTTPリクエストごとに1行で構成されており、各行の先頭にリクエスト元のIPアドレスが記載されています。
このファイルの中で最も多くのリクエストを持つIPアドレスは何かを見つけなさい(同点はない。IPは一意である)。その解答をファイル /home/admin/highestip.txt に書き込んでください。たとえば、あなたの解決策が “1.2.3.4” であれば、次のようになります echo “1.2.3.4” > /home/admin/highestip.txt
解法
/home/admin/access.log
をview
で見ると、行頭にIPアドレスが記載されている、次のようなデータとなっている。
83.149.9.216 - - [17/May/2015:10:05:03 +0000] "GET /presentations/logstash-monitorama-2013/images/kibana-search.png HTTP/1.1" 200 203023 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36"
83.149.9.216 - - [17/May/2015:10:05:43 +0000] "GET /presentations/logstash-monitorama-2013/images/kibana-dashboard3.png HTTP/1.1" 200 171717 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36"
先頭のIPだけを切り出してカウントしたいので、cut
コマンドを使う。
-d ' '
でスペース区切りで分割し、 -f 1
で 1番目の区切り要素(先頭)を出力する。
admin@ip-172-31-27-155:/$ cat /home/admin/access.log | cut -d' ' -f 1
83.149.9.216
83.149.9.216
83.149.9.216
83.149.9.216
83.149.9.216
83.149.9.216
83.149.9.216
83.149.9.216
83.149.9.216
順番を並べ替えるために sort
コマンドを使用。
admin@ip-172-31-27-155:/$ cat /home/admin/access.log | cut -d' ' -f 1 | sort
1.22.35.226
1.22.35.226
1.22.35.226
1.22.35.226
1.22.35.226
1.22.35.226
100.2.4.116
100.2.4.116
100.2.4.116
連続するIPアドレスの数を数えるために、uniq -c
を使用。
行頭にカウント数が記される。
admin@ip-172-31-27-155:/$ cat /home/admin/access.log | cut -d' ' -f 1 | sort | uniq -c
6 1.22.35.226
6 100.2.4.116
84 100.43.83.137
33 101.119.18.35
最後にカウント順でソート。
admin@ip-172-31-27-155:/$ cat /home/admin/access.log | cut -d' ' -f 1 | sort | uniq -c | sort
...
102 209.85.238.199
113 50.16.19.13
273 75.97.9.59
357 130.237.218.86
364 46.105.14.53
482 66.249.73.135
482 66.249.73.135
が最多なので、以下のように書き込んで終了。
admin@ip-172-31-27-155:/$ echo "66.249.73.135" > /home/admin/highestip.txt