python 세 번째 일기 : 크롤링 기초(crawling basic)

2020. 8. 6. 17:59python/crawling

#파이썬 크롤링 세 번째 : CSS의 이해

 

 

css 언어 : Cascading Style Sheet

 

크롤링을 하기위해서 HTML뿐만 아니라 CSS에 대한 기본이해도 필요하다.

그 이유는 CSS는 HTML에 문서의 스타일을 지정할 수 있는 언어기 때문에

웹 페이지 제작시에 필수로 사용되고, 이 때문에 크롤링할 범위를 정확하게 파악하기 위해서는

CSS의 기본구조를 알고, 원하는 위치의 코드를 가져와야한다.

 

문서의 스타일이란, 우리가 워드나 한글에서 글자를 글씨체 설정, 가운데 정렬, 클자크기를 15로,

글자색을 빨간색으로, 글자를 Bold표시 등으로 설정하는 것을 스타일이라고 보면된다.

 

css 언어 적용하기

1. 각 태그별 적용 방법

< 태그 style= "프로퍼티: 값">

*태그: 사용자가 원하는 아무 글자나 설정함 alias와 비슷하게 생각하면됨.

*프로퍼티: text-align , color 등과 같은 속성을 의미

*값: right, red 와 같은 실제로 적용하고자 하는 값을 의미

 

 

1-1 두 가지 프로퍼티 적용하기

<태그 style= "프로퍼티:값 ; 프로퍼티: 값">

 

2. HTML 문서 <head>에 넣어 전체 문서에 적용하기

<head>

     <style type="text/css">

        태그 {

                   프로퍼티 : 값;

                   프로퍼티 : 값;

         }

     </style>

</head>

 

3. HTML 문서 <head>에 다른 문서인 CSS파일 링크

 3-1  별도의 CSS파일 만들기

 3-2 프로퍼티 생성 및 저장

 3-3 <head> 에 불러오기

<head>

    <link rel ="stylesheet" type="text/css" href="경로/파일명.css'>

</head>

 

4.  CSS 스타일 만들기

.이름{

    프로퍼티: 값;

    프로퍼티: 값;

}

 

5. 생성한 CSS스타일 사용하기

<태그 class="이름"> 내용 </태그>

 

 

위의 내용들에 대한 이해를 바탕으로 페이지 소스에서 내가 원하는 데이터를 찾아오면된다!

다음 강의는 실전 크롤링이다.

아직 어렵지만 하나씩 차근차근 공부해야겠다.

 

오늘은 여기까지!