Webスクレイピングって技術あるじゃん?あれってサーバー立てる必要ないよね?

1 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:46:27.117 ID:79ps+9JBM
似たような話だけど別サイトにpostして値を取得する場合ってこれまたサーバー立てる必要ないん?
教えておまいら!
2 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:47:02.376 ID:hNaNL0HFd
サーバーが何か勉強してからこいや
3 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:47:30.107 ID:p2mcxLo70
場合による
4 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:47:41.184 ID:b/vtv+a7M
頭蟻レベルだな
6 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:48:56.632 ID:79ps+9JBM
>>4
猿以下だったの…

やりたいこと:
phpを使ってwebapiにpostでデータ送る

以上です!

9 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:50:27.749 ID:hNaNL0HFd
>>6
普通にphpローカルにインストールすりゃいいじゃん
それがわからなければxamppでも使ってろ
14 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:51:55.086 ID:79ps+9JBM
>>9
phpをローカルにインストールするってどゆこと?
こいつコンパイラいらないんじゃないのん…?
18 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:53:22.717 ID:hNaNL0HFd
>>14
インストールしなかったら誰がphp実行すんのよ
22 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:54:37.821 ID:79ps+9JBM
>>18
えじゃあサーバー立てる場合もphp用のコンパイラをサーバーに入れとかないといけないってことなん?
5 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:47:56.161 ID:G9QDtFMo0
serverlessで行けるだろ
7 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:49:36.699 ID:Z3S7o90dr
ローカルでphp動かすってこと?
13 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:51:03.973 ID:79ps+9JBM
>>7
うん………
だめ…?

ってかtomcatも入ってるからとりあえずサーバー立ててみたんだけどphpのコードがそのまま出力されちゃってワケワカメだったんだよね

15 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:52:00.264 ID:Z3S7o90dr
>>13
別にいいんじゃね?
8 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:49:51.693 ID:79ps+9JBM
あとこの場合ってphp一枚で足りるよね?
jsでやろうかなって最初思ったんだけどjsって単体で発火させる方法あるんでしょうか
11 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:50:44.449 ID:0Oj4Golx0
>>8
Nodeで簡単にできる
17 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:52:37.056 ID:79ps+9JBM
>>11
逆説的に言うと普通のjsでは単体で発火出来ないってこと?
25 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:55:09.914 ID:0Oj4Golx0
>>17
ほんとにJS単体なら無理
Puppeteerとか使えばちょっとセレクタわかるレベルでも扱えるしたぶんスクレイピング要素だと一番楽じゃないかな
27 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:56:11.008 ID:79ps+9JBM
>>25
マジか…!くそじゃん…
やっぱjsってクソだわ
26 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:55:14.501 ID:mNyzG0+r0
>>17
今の時代単にJavaScriptと言ってもバージョン多過ぎて話にならないからな
10 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:50:41.989 ID:G9QDtFMo0
aws lambdaでも使ってcronで発火すればいいよ
12 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:50:58.475 ID:17de+HZS0
職場に行くのに定期券って買う必要があるかなって言ってるように聞こえる
別に毎回きっぷ買ってもいいですよ
16 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:52:32.543 ID:ZPCU+pcg0
それぐらいならgoogle apps scriptで出来るよ。
19 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:53:50.780 ID:79ps+9JBM
>>16
gas全くわかんないからphpでやりたいなって思ってます!
20 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:54:09.374 ID:mNyzG0+r0
態々PHPである必要もないけどな
node.jsなら、JavaScriptで出来るし、C++とかならライブラリやframeworkによるけど個人的にQtとかなら、レスポンスのdomをパース出来るからおすすめ

プログラムとしてスクレイピングを必要とするなら、サーバーは必要だけど、

スクレイピングした結果を様々なプログラムに反映させたいならサーバーが必要だったり、必要じゃなかったり

21 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:54:16.324 ID:17de+HZS0
スクレイピングを実地でやってないのにサーバーを立てるかどうか検討してるの?
それは順序が間違ってるよ
23 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:55:00.975 ID:N5SPDbGU0
頭いいのか悪いのかわからん
24 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:55:06.140 ID:Z3S7o90dr
なんでローカルで十分なのにお前らクラウド使わせようとさせてくるん
28 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:56:38.455 ID:0Oj4Golx0
PHPのがクソだぞ
29 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:57:35.948 ID:p2mcxLo70
言語とインタプリタ混同するレベルならスクレイピングする前にやることあるよ
34 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:59:55.989 ID:79ps+9JBM
>>29
そういう初歩のことなんも知らないのん…
どうやって勉強すりゃいいのか分からんし勉強したところで次の日には全部抜けとる…
30 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:58:30.478 ID:17de+HZS0
まずローカルでプログラムを動かしローカルサーバーを立てて見てからAWSなりなんなりが必要か検討しろ
31 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:58:42.448 ID:79ps+9JBM
え結局結論としてサーバーは立てる必要ないってことだよね?

phpの場合は別途コンパイラをローカルに入れとく必要があって、jsの場合は自然発火できないからnode.jsかイベント作れってことね?
んでvipperとしてはgasとかその他簡単な言語でやれと!

42 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:04:28.845 ID:mNyzG0+r0
>>31
お前PHPしかまともに使えない奴だろ

他の言語扱える者としてはサーバー(プログラム)を動かして態々サーバー上でPHPを実行させようとしてて無駄に感じるんだよ

node.jsなら、単体でフロントエンド・バックエンド・サーバーのプログラムを実装出来る

Java,C++,C#とかもライブラリやframework使えば単体でcurlなり扱って、domパース出来る

32 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:58:55.534 ID:ZPCU+pcg0
curlで良いのでは?とも思った。
33 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 20:59:40.142 ID:17de+HZS0
>>32
curlってhtmlからデータ抽出できるの?
それはクローラでは
36 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:01:33.228 ID:ZPCU+pcg0
>>33
curlだってリクエストを投げてレスポンスを得るんだから、まぁ何だっていいと思うよ
41 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:04:15.511 ID:17de+HZS0
>>36
スクレイピングというのはhtmlレスポンスからxpath的に要素を抽出してデータを集計するまでの過程を指すと思ったのでアスペツッコミを入れたのだ
35 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:00:50.506 ID:79ps+9JBM
ってかさそしたらけっきょくサーバーが必要になるシチュってなんなの?
ローカルサーバーってなんだよ
37 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:01:36.490 ID:Z3S7o90dr
>>35
外部にサイト公開したいときとか
40 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:03:48.033 ID:79ps+9JBM
>>37
それってローカルってよぶん?
43 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:04:40.134 ID:Z3S7o90dr
>>40
ローカルは手元で開発するときに使うとか
48 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:07:42.757 ID:mNyzG0+r0
>>35
名前のまんま、同じネットワーク上のリクエストを受けてレスポンスを返す

DLANとかもローカルネットワーク上で、同じネットワークに繋いだ機器同士の通信出来る

38 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:02:04.142 ID:ZPCU+pcg0
何をしたいかちゃんと書けばちゃんと答えてやるよって人が多いから
ちゃんと書けば?
47 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:07:03.587 ID:79ps+9JBM
>>38
17時ぐらいに天才エンジニアvipperが来ててさ
その人がプログラミングで5chに書き込む方法教えてくれたんだよ
是非実行したいなって思ったんだけど上手くいかなくて…

やりたいことは5chに書き込む、ただそんだけ!
レスポンスはいらね!
ステータスだけ返ってくりゃいいよ!

49 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:08:01.157 ID:gFLN8/PqH
>>47
そのプログラムを自分のpcなりで実行すれば書き込みができる
51 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:11:29.122 ID:ZPCU+pcg0
>>47
実行したときのエラーを見て対処すれば良いだけなのでは…?どうせクッキーとかuser agentとかその周りだろ
専ブラ模倣するときはなんかあれをアレしなきゃ行けなかった気がするから分からんけど。
53 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:12:21.098 ID:mNyzG0+r0
>>51
httpかhttpsとかでもハマってそう
39 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:02:45.278 ID:79ps+9JBM
やべぇ自分がポンコツ過ぎてクソイライラしてきたわ

あとさjavaのサーブレット!
これも単体では動かせられないの?
httpRequestとhttpResponseって引数が必要なんだけどどっから持ってくればいいのか全くわかんね
一ミリもわかんね…

44 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:05:31.588 ID:ZPCU+pcg0
てかphperなのにweb分からんてどゆことだよ笑
45 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:06:19.679 ID:ZPCU+pcg0
ああwordpress的なphperか(´・ω・`)
46 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:06:20.000 ID:gFLN8/PqH
本業だがなにしたいのかさっぱりわからん
個人でやるならローカルでプログラム実行すればええんやないの?
50 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:10:57.695 ID:79ps+9JBM
ちなみに第一言語はjavaだったよ
phpは半年前に一週間だけ使ったっきり
だからコピペしかできん!

ってか画像貼りたいんだけど連投ですゆのせいで貼れん……

52 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:12:05.044 ID:mne/2XJP0
pythonでいいだろ
ライブラリでスクレイピングは10行以内でできる
post処理もライブラリで三行出かける
54 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:13:02.679 ID:ZPCU+pcg0
(てか書き込みは最早スクレイピングじゃないやん)
55 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:13:51.247 ID:TrRS0lUnr
>>54
最近はcsrf対策とかされてるからスクレイピング的なのしなきゃな気がする
56 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:15:25.032 ID:ZPCU+pcg0
順序立ててちゃんとやるならYahoo天気とか無難なところを取得するなど楽チンコースからやろうぜ
57 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:16:22.445 ID:79ps+9JBM
ああ!連投ですゆうぜぇ!!!
4ね!!!!
クソカス4ね!!!
お前ら5分待ってくださいお願いしますなんでもします!
58 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:22:46.796 ID:79ps+9JBM
クソ…!書き込めなかった…
59 名前:ひみつの名無しさん 投稿日時:2019/10/30(水) 21:23:04.304 ID:mNyzG0+r0
手始めに気象庁から情報取得するプログラムでも作っとけ

まぁスクレイピングと言うか一定のルールに従ってURLパラメータ変えるだけなんだけど

コメント

タイトルとURLをコピーしました