Pobieranie zawartości ze strony

Forum poświęcone językowi C#.

Moderator: xxSlayeRxx

Pobieranie zawartości ze strony

Sponsor

Sponsor
 

Pobieranie zawartości ze strony

Postprzez marcin0997 » Cz cze 05, 2014 8:53 pm

Witam,
Planuję napisać aplikację, która będzie wyświetlać plan lekcji każdego nauczyciela lub klasy wymienionych na stronie z planem. Program ma wczytywać wartości ze strony www, pobierać tylko sam tekst i wklejać wartości do nowo utworzonej tabeli.
Na chwilę obecną głowię się nad pobraniem zawartości tekstu, którego chcę ze strony z planem lekcji. Znalazłem następujący kod:
Kod: Zaznacz cały
using System.Net;
using System.Text.RegularExpressions;


Kod: Zaznacz cały
using (WebClient client = new WebClient())
            {
                string content = client.DownloadString("strona z planem");

                string text = Regex.Match(content, @"\<th\b[^>]*\>\s*(?<Title>[\s\S]*?)\</th\>", RegexOptions.IgnoreCase).Groups["Title"].Value;

                Console.WriteLine(text);
            }

Mam nadzieję, iż mi pomożecie, w razie potrzeby mogę wkleić kod planu, który został napisany w HTML-u, generowany jest jak większość planów za pomocą programu Plan lekcji Optivum
firmy VULCAN.
marcin0997
New member
 
Posty: 4
Dołączył(a): Cz cze 05, 2014 8:47 pm

Re: Pobieranie zawartości ze strony

Postprzez djszalas » Cz cze 05, 2014 10:25 pm

Poprosze o kod planu. Może mi się uda coś poradzić.
djszalas
Member
 
Posty: 61
Dołączył(a): N maja 20, 2012 10:38 am

Re: Pobieranie zawartości ze strony

Postprzez marcin0997 » Cz cze 05, 2014 11:11 pm

Tak to się przedstawia:
Kod: Zaznacz cały
<body>
<table border="0" cellpadding="0" cellspacing="0" width="100%" class="tabtytul">
<tr>
<td class="tytul">
<img src="../images/pusty.gif" height="80" width="1">
<span class="tytulnapis">D.Czyżewski (Cd)</span></td></tr></table>
<div align="center">
<table border="0" cellpadding="10" cellspacing="0">
<tr><td colspan="2">
<table border="1" cellspacing="0" cellpadding="4" class="tabela">
<tr>
<th>Nr</th>
<th>Godz</th>
<th>Poniedziałek</th>
<th>Wtorek</th>
<th>Środa</th>
<th>Czwartek</th>
<th>Piątek</th>
</tr>
<tr>
<td class="nr">0</td>
<td class="g"> 7:05- 7:50</td>
<td class="l"><span style="font-size:85%"><a href="o8.html" class="o">2A</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">1</td>
<td class="g"> 8:00- 8:45</td>
<td class="l"><span style="font-size:85%"><a href="o8.html" class="o">2A</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">2</td>
<td class="g"> 8:55- 9:40</td>
<td class="l"><a href="o6.html" class="o">1F</a>-w2,<a href="o7.html" class="o">1H</a>-w2 <span class="p">wf</span> <a href="s37.html" class="s">WF3</a><br></td>
<td class="l">&nbsp;</td>
<td class="l"><a href="o6.html" class="o">1F</a>-w2,<a href="o7.html" class="o">1H</a>-w2 <span class="p">wf</span> <a href="s37.html" class="s">WF3</a><br></td>
<td class="l">&nbsp;</td>
<td class="l"><a href="o1.html" class="o">1A</a>-w2,<a href="o2.html" class="o">1B</a>-w2 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
</tr>
<tr>
<td class="nr">3</td>
<td class="g"> 9:50-10:35</td>
<td class="l"><span style="font-size:85%"><a href="o18.html" class="o">3D</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l"><a href="o18.html" class="o">3D</a> <span class="p">godz.wych</span> <a href="s4.html" class="s">107</a><br></td>
<td class="l"><a href="o6.html" class="o">1F</a>-w2,<a href="o7.html" class="o">1H</a>-w2 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
<td class="l">&nbsp;</td>
<td class="l"><span style="font-size:85%"><a href="o4.html" class="o">1D</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
</tr>
<tr>
<td class="nr">4</td>
<td class="g">10:50-11:35</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l"><a href="o1.html" class="o">1A</a>-w2,<a href="o2.html" class="o">1B</a>-w2 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
<td class="l">&nbsp;</td>
<td class="l"><span style="font-size:85%"><a href="o8.html" class="o">2A</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
</tr>
<tr>
<td class="nr">5</td>
<td class="g">11:45-12:30</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l"><a href="o1.html" class="o">1A</a>-w2,<a href="o2.html" class="o">1B</a>-w2 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">6</td>
<td class="g">12:40-13:25</td>
<td class="l">&nbsp;</td>
<td class="l"><span style="font-size:85%"><a href="o18.html" class="o">3D</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">7</td>
<td class="g">13:35-14:20</td>
<td class="l">&nbsp;</td>
<td class="l"><span style="font-size:85%"><a href="o18.html" class="o">3D</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l"><span style="font-size:85%"><a href="o4.html" class="o">1D</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">8</td>
<td class="g">14:40-15:25</td>
<td class="l">&nbsp;</td>
<td class="l"><span style="font-size:85%"><a href="o5.html" class="o">1E</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l"><span style="font-size:85%"><a href="o4.html" class="o">1D</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l"><a href="o28.html" class="o">1az</a> <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">9</td>
<td class="g">15:35-16:20</td>
<td class="l">&nbsp;</td>
<td class="l"><a href="o28.html" class="o">1az</a> <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
<td class="l"><span style="font-size:85%"><a href="o5.html" class="o">1E</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l"><a href="o28.html" class="o">1az</a> <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></td>
<td class="l">&nbsp;</td>
</tr>
<tr>
<td class="nr">10</td>
<td class="g">16:30-17:15</td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
<td class="l"><span style="font-size:85%"><a href="o5.html" class="o">1E</a>-w1 <span class="p">wf</span> <a href="s35.html" class="s">WF1</a><br></span></td>
<td class="l">&nbsp;</td>
<td class="l">&nbsp;</td>
</tr>
</table>
</td></tr>
<tr><td align="left">
Obowiązuje od: 12 maja 2014 r.
</td></tr>
<tr><td align="left"><a href="javascript:window.print()">Drukuj plan</a></td><td class="op" align="right">
<table border="0" cellpadding="0" cellspacing="0">
<tr><td align="right">
wygenerowano 2014-05-09<br>
za pomocą programu
<a href="http://www.vulcan.edu.pl/dla_szkol/optivum/plan_lekcji/Strony/wstep.aspx" target="_blank">Plan lekcji Optivum</a><br>
firmy <a href="http://www.vulcan.edu.pl/" target="_blank">VULCAN</a></td>
<td><img border="0" src="../images/plan_logo.gif" style="margin-left:10" alt="logo programu Plan lekcji Optivum" width="40" height="40"></td>
</tr></table>
<tr><td>
<script type="text/javascript" src="../scripts/powrot.js"></script>
</td></tr>
</td></tr></table></div>
</body>

Byłbym wdzięczny za pomoc.
marcin0997
New member
 
Posty: 4
Dołączył(a): Cz cze 05, 2014 8:47 pm

Re: Pobieranie zawartości ze strony

Postprzez xxSlayeRxx » Pt cze 06, 2014 9:57 am

ja bym zabral sie za to inaczej: http://htmlagilitypack.codeplex.com/
xxSlayeRxx
Member
 
Posty: 661
Dołączył(a): Pt lip 08, 2011 10:24 pm

Re: Pobieranie zawartości ze strony

Postprzez marcin0997 » Pt cze 06, 2014 2:30 pm

A mógłbyś mi podać przykladowy kod dla tej paczki, bo jak szukałem w internecie poradników, przykładów, to za każdym razem miałem wyskakiwał mi błąd (i to nie ze względu na brak paczki). Najlepiej by był kod wyświetlający tekst Poniedziałek z w/w kodu, dałoby radę zrobić coś takiego?
marcin0997
New member
 
Posty: 4
Dołączył(a): Cz cze 05, 2014 8:47 pm

Re: Pobieranie zawartości ze strony

Postprzez djszalas » Pt cze 06, 2014 6:26 pm

Próbuje zrobić jakiś serializer w C# zeby działało jak w XML ale chyba nie bedzie to takie proste :D
djszalas
Member
 
Posty: 61
Dołączył(a): N maja 20, 2012 10:38 am

Re: Pobieranie zawartości ze strony

Postprzez marcin0997 » Pt cze 13, 2014 10:52 pm

Jak Ci idzie z tym serializerem? Czy może po prostu sobie odpuściłeś?
marcin0997
New member
 
Posty: 4
Dołączył(a): Cz cze 05, 2014 8:47 pm

Re: Pobieranie zawartości ze strony

Postprzez Riw » So cze 14, 2014 11:52 am

Może spróbuj to zrobić przy użyciu technologi oferowanych przez ASP.NET
Riw
Member
 
Posty: 36
Dołączył(a): Śr mar 26, 2014 6:37 am

Re: Pobieranie zawartości ze strony

Sponsors

Sponsor
 


Powrót do C#

Kto przegląda forum

Użytkownicy przeglądający ten dział: Brak zidentyfikowanych użytkowników i 10 gości