Forum

> > Off Topic > Auslesen einer *.asp seite
Forums overviewOff Topic overviewLog in to reply

German Auslesen einer *.asp seite

23 replies
Page
To the start Previous 1 2 Next To the start

old Auslesen einer *.asp seite

Guest

Quote
Ich hab mich bisher noch nicht so richtig mit ASP befasst.
Nun muss ich aber eine Aufgabe erledigen die sehr Zeitaufwändig ist und eventuell vereinfacht werden kann:

Ich hab eine Seite voller links (die Seite und die verlinken Seiten sind *.asp) und auf den verlinkten Seiten sind Tabelle wo Emailadressen und Inernetseiten drinn stehen. Meine Aufgabe ist es diese Emailadressen und Internetseiten von jedem einzelnen Link in eine Exceltabelle zusammenzufassen. Die verlinkten Seiten sind alle an einem Ort. D. h. nur der Dateiname ist anders.

Zum Beispiel: http://www.bsp.de/onlineinfo-uefasuchedaten.asp?Kennung=DE01BFR ist ein Link. ein anderer wäre:
http://www.bsp.de/onlineinfo-uefasuchedaten.asp?Kennung=DE01AAA

Leider kann ich nicht die original Seiten angeben, da die passwortgesichert sind.

Kennt jemand eine Möglichkeit die Daten automatisch/alle aufeinmal auszulesen?
Oder ist die einzige Möglichkeit die Links "per Hand" aufzurüfen und so an die Informationen zukomme?

Ich bin dankbar für jede Hilfe!
ich.

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Muss es in ASP gemacht werden, und wenn ja, in welchem?
Es gibt ASP über VBA, VBS, VB.NET, C# und theoretisch auch über Delphi.NET oder Chrome.

Je nach dem was du nutzt gibt es uU nämlich schon HTML-Parser als OpenSource, die du dann einfach benutzen kannst um nach Links zu checken.

old Re: Auslesen einer *.asp seite

Guest

Quote
Was meinst du damit: Muss es in ASP gemacht werden?

Also die seiten wo die daten draufstehen sind ASP seiten, aber da wo die ausgelesenen daten hin kommen kann ich selbst bestimmen. Am ende soll es eine excel tabelle werden.

Ich weis nicht wie ich rausbekomme welches ASP das ist hier eine Seitenquelltext falls es hilft:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
<html>
<head>
<meta http-equiv="Content-Language" content="de">
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<title>Übungsfirma Seaside Werbegeschenke Bodensee GmbH</title>
</head>
<body topmargin="0" leftmargin="0">
<table border="0" width="58%">
  <tr>
    <td width="100%" valign="top" bgcolor="#D7D7D7" colspan="2"><font face="Verdana" size="2" color="#000080">
      <p align="center"></font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Kennung</b></font></td>
    <td width="80%" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080">
    DE01BSP</font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Name</b></font></td>
    <td width="80%" bgcolor="#D7D7D7">
    <font face="Verdana" size="2" color="#000080">Bsp GmbH</font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Anschrift</b></font></td>
    <td width="80%" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080">D 00000 Irgendwo< br>
    Bspstr. 00</font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Telefon</b></font></td>
    <td width="80%" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080">+ 49 (0123) 
    4567891</font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Fax</b></font></td>
    <td width="80%" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080">+ 49 (0123) 
    4567891</font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Kontaktperson</b></font></td>
    <td width="80%" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080">
    Herr MüllerHerr Meier</font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>Webseite</b></font></td>
    <td width="80%" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><a href="http://www.bsp.de" target="_blank">http://www.bsp.de</a></font></td>
  </tr>
  <tr>
    <td width="20%" valign="top" bgcolor="#D7D7D7"><font face="Verdana" size="2" color="#000080"><b>EMail</b></font></td>
    <td width="80%" bgcolor="#D7D7D7">
    <a href="mailto:bsp@bsp.de"><font face="Verdana" size="2">
    bsp</font></a><font face="Verdana" size="2" color="#000080"><a href="mailto:bsp@bsp.de">@bsp.de</a></font></td>
  </tr>
</table>
</html>

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Gast has written
Was meinst du damit: Muss es in ASP gemacht werden?

Geht es auch in einer Sprache/Einem Sstem das man lokal, ohne ASP-Fähigen Webserver ausführen kann (ASP ist Microsofts antwort auf CGI, also Serverseitige Dynamische Websites)?

Gast has written
Also die seiten wo die daten draufstehen sind ASP seiten, aber da wo die ausgelesenen daten hin kommen kann ich selbst bestimmen. Am ende soll es eine excel tabelle werden.

Ich weis nicht wie ich rausbekomme welches ASP das ist hier eine Seitenquelltext falls es hilft:

Ah, jetzt klingelts! Du willst eine ASP-Seite auslesen, nicht eine Seite mit ASP auslesen!

Also, in dem Fall nimm die Programmiersprache deiner wahl (was besseres als QBasic oder Turbo Pascal sollte es aber schon sein), suche dir im internet routinen zum parsen von html und zum schreiben von Exceltabellen (letzteres dürfte das größte problem sein) und programmiere es entsprechend der tabellenstruktur die die Seite hat.
Einfachst mögliche wäre vermutlich VBA, da es schwer ist an eine Kostenlose Delphi-Version mit Office-Bindings zu kommen.

Mit was proggste den so, normalerweise?

old Re: Auslesen einer *.asp seite

Guest

Quote
naja ich weis nicht ob man das überhaupt richtig proggen nennen kann, aba ich probiere mich zu zeit in html.
Davor habe ich erst pascal in der schule angefangen zu lernen und zuhause noch ein bissel weiter aba is auch nur grad so: also nix so richtig! (LEIDER!!!)
das mit der excel tabelle is nicht ganz so wichtig, haupt sache ich hab alle angaben auf einer seite/datei.

wäre es möglich dass du mir nen bsp. quelltext in html gibst?

DANKE!!!

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Gast has written
naja ich weis nicht ob man das überhaupt richtig proggen nennen kann, aba ich probiere mich zu zeit in html.

Das ist keine Programmiersprache.

Gast has written
Davor habe ich erst pascal in der schule angefangen zu lernen und zuhause noch ein bissel weiter aba is auch nur grad so: also nix so richtig! (LEIDER!!!)

Turbo Pascal, Delphi, FreePascal oder was ganz anderes?
Nur damit ich weiß was ihr kompilieren könnt. Bitte mit Versionsnummer sagen (also Delphi 6 oder FPC 2 oder sowas.)

Gast has written
das mit der excel tabelle is nicht ganz so wichtig, haupt sache ich hab alle angaben auf einer seite/datei.

wozu sollt ihr den spaß dann auslesen?
Die Daten sind doch auf der Website gut aufgehoben.


Gast has written
wäre es möglich dass du mir nen bsp. quelltext in html gibst?

rofl! Der is gut!
Nee, nichts für ungut, aber man kann wie gesagt in HTML nicht programmieren. Das ist eine Formatierungssprache zum Gestalten.

Also, wenn du mir sagst welches Pascal ihr Kompilieren könnt, und mir zugang zu dem auszulesenden Datenblatt gibst kann ich eventuell gucken was sich machen lässt.

old Re: Auslesen einer *.asp seite

Guest

Quote
ich habe borland pascal 7.0!

bizzl has written
wozu sollt ihr den spaß dann auslesen?
Die Daten sind doch auf der Website gut aufgehoben.


Ich bin in zwischen azubi zum Bürokaufman und ich lerne in einer Übungsfirma. das ist eine firma die nur fiktiv existiert, wie viele andere auch (in Deutschland ca. 570; auf der Welt ca. 2700). Wer mehr wissen will: HIER

Und in der Üfa wo ich bin sind viele sachen nicht optimalund ich versuche einies davon zu verbessern. Zum Beispiel nicht 100te gleiche Faxe an alle Üfa's schicken anstatt 1 Mail an alle. Und da wir noch nicht alle Email adressen zusammen haben, aber sie sind auf verschiedenen Seiten wie ich oben beschrieben habe.

da da ja die mail adressen stehen und wir eine mail schicken wollen und wir dort Outlook nutzen und wie sollen wir sonst and die adressen kommen wenn wir die nicht auslesen???!

danke,
ich.

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Gast has written
ich habe borland pascal 7.0

BP7 ist dasselbe wie TP7, nur mit Grafischer Benutzeroberfläche.

Ich würde als Ersatz Delphi 2005 Personal vorschlagen, das ist ganz gut und moderner. Man muss sich zwar erst etwas in das Objekt-Orientierte Programmieren reinfinden, aber das geht relativ schnell.

Gast has written
bizzl has written
wozu sollt ihr den spaß dann auslesen?
Die Daten sind doch auf der Website gut aufgehoben.


Ich bin in zwischen azubi zum Bürokaufman und ich lerne in einer Übungsfirma. das ist eine firma die nur fiktiv existiert, wie viele andere auch (in Deutschland ca. 570; auf der Welt ca. 2700). Wer mehr wissen will: HIER

Und in der Üfa wo ich bin sind viele sachen nicht optimalund ich versuche einies davon zu verbessern. Zum Beispiel nicht 100te gleiche Faxe an alle Üfa's schicken anstatt 1 Mail an alle. Und da wir noch nicht alle Email adressen zusammen haben, aber sie sind auf verschiedenen Seiten wie ich oben beschrieben habe.

kann ich ja nicht wissen das es so einen praktischen Nutzen haben soll
Was benutzt ihr für ein Excel? Schau mal, ob es XML-Dateien importieren kann (Datei->Öffnen, dann in der Combobox gucken).

Gast has written
da da ja die mail adressen stehen und wir eine mail schicken wollen und wir dort Outlook nutzen und wie sollen wir sonst and die adressen kommen wenn wir die nicht auslesen???!

Schon mal was von Datentypisten gehört?


Ich bin in diesem falle aber mal freundlich.
könntest du mir eine vollständige Der inputseite geben? Dann kann ich eventuell probieren etwas zu basteln.
Wenn du es selber machen willst:
•Inputdatei als String laden
•Alles bis <table entfernen
•Alles hinter </table>
•Sämtliche Formatierungstag (<b> <font> <a>) entfernen
•alle Tag-Parameter (width=, valign=, bgcolor=) entfernen
•eventuell jeweils die erste Zelle je Zeile löschen
•Text zwischen den <td> und </td> auslesen und in das passende XML-Format überführen (das wird lustig).

ich hab die liste jetzt in der annahme erstellt das alle Inputseiten (also die von dem die daten gelesen werden) gleich formatiert sind (Grüße an den Typen der das verbrockt hat, das ist die schlechteste art zu formatieren die ich je gesehen habe, und ich hatte früher StarOffice Writer für sowas benutzt!).

Wenn ich es machen soll musste mir mal übers wochenende oder noch länger zeit geben (ich hab ab nächste woche prüfungen), dann bastel ich dir das in D2005. Kann aber nix versprechen!

old Re: Auslesen einer *.asp seite

Guest

Quote
bizzl has written
Was benutzt ihr für ein Excel? Schau mal, ob es XML-Dateien importieren kann

Ein Grund warum ich diese Üfa hasse: uralte, langsame Recchner (win98) mit Excel97. ich wieß (noch nicht) ob ich xml dateien importieren kann. Ich guck morgen mal nach.

bizzl has written
könntest du mir eine vollständige Der inputseite geben?

Falls du meinst und es dir ausreicht eine vollständige Liste der inputseitenendung, das was immer anders ist, dann guck mal bitte in dein emailpostfach.

bizzl has written
Wenn ich es machen soll musste mir mal übers wochenende oder noch länger zeit geben (ich hab ab nächste woche prüfungen)

Es hat Zeit mindestens bis ende der Ferien, da ich vorher (außer morgen) nicht mehr da hin komme wegen urlaub. Und wenns länger dauer auch nicht schlimm, bin überhaupt dankbar dass du mir hilfst!

bizzl has written
dann bastel ich dir das in D2005. Kann aber nix versprechen!

Was ist D2005? Ist das was von Delphi? Wenn ja dann kein problem, ich werd mir delphi besorgen.

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Gast has written
bizzl has written
könntest du mir eine vollständige Der inputseite geben?

Falls du meinst und es dir ausreicht eine vollständige Liste der inputseitenendung, das was immer anders ist, dann guck mal bitte in dein emailpostfach.

Hmmm....
sieht aus wie parameter.
Hmmm....
Also, wenn ich das richtig sehe, dann wird je Seitenaufruf ein Mitarbeiterprofil angezeigt. na super
naja, aber es wird schon irgendwie gehen.
Ich hab mir derweil schon mal einige Vorbereitungen getroffen. Siehe Email.

Gast has written
Es hat Zeit mindestens bis ende der Ferien, da ich vorher (außer morgen) nicht mehr da hin komme wegen urlaub. Und wenns länger dauer auch nicht schlimm, bin überhaupt dankbar dass du mir hilfst!

na, dann ist ja gut.

Gast has written
Was ist D2005? Ist das was von Delphi? Wenn ja dann kein problem, ich werd mir delphi besorgen.

D2005 = Delphi 2005.
also ja.

old Re: Auslesen einer *.asp seite

Guest

Quote
also wenn du das als xml machst kann ich es ja hier bei mir zu hause entsprechend lesbar machen.

achja ich wohne im hotel mama! (aus bequemlichkeit und alter -> 17,5)

PS.: Email

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Gast has written
Gibt es noch ne andere Möflichkeit Daten von einer anderen Seite zu holen außer über frames?

Daten über Frames?
Oh, du meinst eine fremde/andere Seite in deine einbinden?
Also, wenn dein Webhost/Server php hat kannste das mit include("Dateiname"). Bei Hostfremdenseiten geht das aber net.
Ansonsten gibt es keine Möglichkeit, da fremdseiten normalerweise eine eigene formatierung für <body> und einen eigenen block <head> besitzen und deins dann überschrieben würde.

old Re: Auslesen einer *.asp seite

Guest

Quote
Also nur wenn ich ne HP habe mit php.
Und noch ne andere Möglichkeit gibts also leider nicht?!
Eigentlich wollte ich damit offline bleiben.

Hast du inzischen Zeit gehabt?

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
Gast has written
Also nur wenn ich ne HP habe mit php.
Und noch ne andere Möglichkeit gibts also leider nicht?!
Eigentlich wollte ich damit offline bleiben.

nein, woher auch. Ursprünglich war diese Art der Dateneinbeziehung (sowohl über frames als auch über php) gar nicht vorgesehen.

Gast has written
Hast du inzischen Zeit gehabt?

Nein, leider nicht. Mein kleiner Bruder blockiert häufig den Rechner mit dem Delphi (ist gleichzeitig der Spielerechner), und mit FreePascal unter Linux habe ich noch so meine Liebe not (IDE etwas sehr buggy). Ich habe aber jetzt alle prüfungen hinter mir, und mit etwas glück schaffe ich das noch innerhalb der schulferien (meine eigenen gehen noch bis ende März )

old Re: Auslesen einer *.asp seite

weltsieger
User Off Offline

Quote
Wäre es möglich noch ne Servereinstellung für nen Proxyserver vorzunehmen?

Also in meinem Betrieb gehen wir über einen Proxyserver ins inernet und deshalb kommt dein tolles programm nicht klar und bricht mit ner zeitüberschreitung ab.

Ansonsten bei mir zuhause läuft es wunderbar!!!

Danke im vorraus.

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
ich glaube nicht.
Ich habe auch lange nicht mehr mit Delphi programmiert, insbesondere nicht mit den Indys, ich müsste erst gucken und tuts suchen,sry.

old Re: Auslesen einer *.asp seite

weltsieger
User Off Offline

Quote
ist ja nicht so eilig!

Wieso hattest du mir eigentlich abgeraten es mit Pascal 7.0 zu probieren?

Achja noch ne sache die doch nicht ganz so 100% funzte: ich habs irgend wie net hinbekommen dass alle infos von der seite ausgelesen werden: Es wurden immer nur Kennung, Email, I-Netseite und Webshop angezeigt.
keine ahnung warum ... ich hab wie du geschrieben hast die // bei der out.pas entfernst.

Thx.

old Re: Auslesen einer *.asp seite

bizzl
User Off Offline

Quote
i c h has written
Wieso hattest du mir eigentlich abgeraten es mit Pascal 7.0 zu probieren?

Es ist zwar grundsätzlich möglich mit Turbo Pascal inet-Anwendungen zu machen, aber ob es sinnvoll ist
Zum einen gibt es keine units für sowas, du müsstest alles selber coden, und zum anderen gehen Turbo Pascal-Programme nur auf rechnern <200Mhz. Es ist zwar möglich die zu patchen (bzw die betroffenen units), aber das ist tricky.
Außerdem ist Delphi Objektorientiert, was diverse sachen um einiges einfacher macht

i c h has written
Achja noch ne sache die doch nicht ganz so 100% funzte: ich habs irgend wie net hinbekommen dass alle infos von der seite ausgelesen werden: Es wurden immer nur Kennung, Email, I-Netseite und Webshop angezeigt.
keine ahnung warum ... ich hab wie du geschrieben hast die // bei der out.pas entfernst.

Thx.

Poste mal was du geändert hast. ich guck auch nochmal ob der fehler auch bei mir auftritt...
To the start Previous 1 2 Next To the start
Log in to replyOff Topic overviewForums overview