- 1 : 2024/06/13(木) 19:58:31.332 ID:rcOfId1w0
-
例えば日本全国の図書館のサイトから蔵書一覧をスクレイピングして
重複してる名前は削除してエクセルに出力するプログラミングを組んで欲しい場合って
相場いくらくらいが適正? - 2 : 2024/06/13(木) 19:58:59.608 ID:nYxJPjl90
-
来たけど>>1が見えない
- 3 : 2024/06/13(木) 19:59:58.485 ID:rcOfId1w0
-
>>2
専ブラのng設定すら出来ないのは流石に三流だからお断りです - 7 : 2024/06/13(木) 20:02:19.656 ID:CNRjSZTe0
-
>>3
出来てるから見えないんじゃないの - 12 : 2024/06/13(木) 20:05:02.313 ID:rcOfId1w0
-
>>7
初期設定から変更できないから、見たい時に解除できてないということでしょう - 4 : 2024/06/13(木) 20:00:56.124 ID:djVr84mJ0
-
教えてあげないよ~
- 5 : 2024/06/13(木) 20:01:19.458 ID:rcOfId1w0
-
>>4
教えてください
10万だと安すぎますか? - 6 : 2024/06/13(木) 20:01:51.721 ID:rcOfId1w0
-
因みに維持管理の必要はありません
- 8 : 2024/06/13(木) 20:02:46.299 ID:Q9iReXIT0
-
なんかそれで捕まったやつ居たよな
- 10 : 2024/06/13(木) 20:04:12.595 ID:rcOfId1w0
-
>>8
あれはデータスクレイピングがまだ認知されてなかった時の事件だったと記憶しています
今はサイト側が許可か拒否か選べて、ソースか何かを見ればどちらなのか分かると聞いたことはあります - 9 : 2024/06/13(木) 20:03:08.406 ID:rcOfId1w0
-
あと、出来が望んだものでなくても10万円は渡します
それに加えて望んだものができていた場合は似たようなものを10件合計100万円で依頼したい感じです - 11 : 2024/06/13(木) 20:04:43.653 ID:vDQGhG4c0
-
全国の図書館のサイトって共通のフォームなの?
- 14 : 2024/06/13(木) 20:06:08.374 ID:rcOfId1w0
-
>>11
そこが一つの味噌です
その手間も加味して、10万or110万の案件は適性かどうかを尋ねたいです - 13 : 2024/06/13(木) 20:05:12.931 ID:xfXI3DnZr
-
いったん10人日で50万かな
- 15 : 2024/06/13(木) 20:06:43.469 ID:rcOfId1w0
-
>>13
50万ですか
参考になります - 16 : 2024/06/13(木) 20:07:14.081 ID:rcOfId1w0
-
>>13
10人日ってのは10人で作業して1日あたり50万ってことで合ってますか? - 17 : 2024/06/13(木) 20:08:42.682 ID:rcOfId1w0
-
ただ、簡単にいうとデータベースのフォームは3種類だと思ってください
実際の図書館のフォームはバラバラだと思いますが、本当に頼みたいものはフォームが3種類に分かれています - 18 : 2024/06/13(木) 20:11:12.955 ID:RuOEwe8/0
-
日本図書館協会「日本の図書館統計」によると、2020年の公共図書館は3,316館となっており、図書館法に基づく図書館が設置されていないのは、2020年時点で全国815市区のうち8市です。
ざっくり800の市区毎に共通の形式だったとして8市区町村/何日としても100人日くらいか
- 19 : 2024/06/13(木) 20:11:35.496 ID:+uRcj3Mc0
-
ハイパー大雑把だけど
1日8時間動いて
5万くらいが最低ラインと考えればいいんじゃね?>>1と話して使用を詰める時間も含めてなので
10万では安いとは思う - 20 : 2024/06/13(木) 20:12:13.857 ID:RBo2WaSId
-
市区町村1500以上あるのに各市区町村の図書館リストアップしてスクレイピングの当たりつけるだけで10万じゃ足りん
- 21 : 2024/06/13(木) 20:12:26.984 ID:kyNXQL/x0
-
全国の図書館のサイトのURL調べるだけで1ヶ月かかりそう
- 22 : 2024/06/13(木) 20:15:05.558 ID:9uRp+PJZ0
-
日本全国の図書館のサイトを提示してくれないと無理だね
- 23 : 2024/06/13(木) 20:15:42.160 ID:uxrg9f9p0
-
>>1の頭の中のふんわり要件をまともな仕様に起こすだけで10万円分の仕事になりそう
- 25 : 2024/06/13(木) 20:18:43.760 ID:rcOfId1w0
-
>>23
実は手動でシステム構築はしてます
要するにそれの自動化を頼みたいのです
ふんわりも何も、もう手動での完成系は出来てるわけです
そしてこれの時間がかかるので時短したいのが私の要求です - 24 : 2024/06/13(木) 20:17:28.141 ID:rcOfId1w0
-
ありがとうございます
因みに図書館の例で言うところの、全ての図書館サイトのURLに値するものはこちらが不思議な力で連番にするものとします
チャットGPTに読み込ませて動かなかったので、間違いの雛形をこちらが用意してそちらに添削修正してもらう形でも構いません
最初の1件できちんとこちらが伝えられたかどうか判断する為、打ち合わせも4時間ほどあれば良いかと思います
残りの12時間でプログラムを添削修正出来れば10万で可能かとは思いますが難しいでしょうか - 27 : 2024/06/13(木) 20:22:28.922 ID:+uRcj3Mc0
-
>>24
スクレイピングで面倒なのはURLよりも
ページ内のDOM構造の把握だと思うそれにGETではなくPOSTでリクエスト投げるシステムだったら
そもそもURLと検索結果がマッチしないしね - 29 : 2024/06/13(木) 20:24:19.021 ID:rcOfId1w0
-
>>27
用語は全く分かりませんが、ソースを理解して抜き取り先の指定が適切にできるかどうかが重要と言うことでしょうか
それであればその通りだと思います
現に私がチャットGPTを使っても組めなかったのは、そこが原因なので - 26 : 2024/06/13(木) 20:20:31.312 ID:rcOfId1w0
-
今は10万分の案件の1/3程は手動で完遂済みですので、「どう言ったことをしたい」と言うのを理解するのにさほど時間は掛からないかと思います
- 28 : 2024/06/13(木) 20:22:42.974 ID:rcOfId1w0
-
あと厳密に言うとエクセルではなくGoogleスプレッドシートです
この差が可否に関わる可能性もある為訂正します - 30 : 2024/06/13(木) 20:26:29.184 ID:kyNXQL/x0
-
そもそも蔵書一覧なんてページあんの?
- 32 : 2024/06/13(木) 20:30:27.221 ID:rcOfId1w0
-
>>30
図書館はあくまで例なので、蔵書一覧があるものとします
私個人的にはこのデータは価値があるものだと判断してる為伏せたいので遠回しな言い方になりますが「あるもののリストを作りたいけど、重複が非常に多いので一旦全てリストアップした後に重複分を消したい、リストは重複分含めて26万4千件、重複分を省くと1万件ほどになる為、手動では時間がかかりすぎる、スクレイピングしたいページは3万3千程」です - 31 : 2024/06/13(木) 20:26:38.055 ID:XggxmFtR0
-
参考の図書館だしてくれ
コメント