본문 바로가기

학교공부

(64)
클라우드 컴퓨팅 4장 오늘 할거 이러면 http protocol로 전송한다. 물리적으로는 이렇게 돌아감 packet으로 잘게 쪼개서 보내고 받는다. 패킷 경로는 각 라우터가 판단해서 그때그때 다름. 다음배울거 병목현상 거리 멀긴해도 빛의 속도가 빨라서 빨리감. 에러처리를 위한 계층 3번 패킷에 대한 ack가 안오니까 TCP가 알아서 3번을 다시 보내준다. 그럼 매우 편하지~ 혼잡제어 너무 많이 쏴버리면 아까 위에서 보틀넥같은 경우에 capacity줄어들면 네트워크 마비됨 여러 알고리즘이 있는데 위에것만 말하면 처음에는 속도를 빠르게 올리기위해 exponential하게 속도를 올리다가 일정 부분(thresh hold)부터 linear하게 증가한다. 그러다가 packet loss가 발생하면 cwnd를 반으로 줄여버린다 다음배울거..
클라우드 컴퓨팅 3장 오늘 배울거 뭐 여러가지 app 돌아감 vm vmm이 vm간에 isolation 만들어줌 장점 1. Migration shut down해야할경우 껏다킬필요없이 alice가 다른 machine에 migration(옮기기)하면 customer은 그냥 사용하던대로 사용할 수 있음 2. Time Sharing Multiple VMs can time-share the existing resources Result: Alice has more virtual CPUs and virtual memory than physical resources (but not all can be active at the same time) overcommitting resources(time sharing 같이 가지고있는거보다 더 제..
클라우드 컴퓨팅 3/11 Salable computer system(memory, hardware 등등이 size up down이 가능하냐) software(nodejs와 같은 서버를 늘릴경우 size up down이 가능하냐) data 많아지면 single machine으로는 처리불가 Scale up : 더 큰 컴퓨터를 산다(성능좋은), 더 많은 컴퓨터를 산다. PC - Server - cluster(own single pc에서 관리함 보통) 근데 요새는 이런거 안하고 클라우드 서비스를 갖다쓰면 된다~ 암튼 cluster의 문제 1. 열관리 2. 대규모 전력 그래서 보통 강옆에 지음 ㅇㅇ computer system(memory, hardware 등등이 size up down이 가능하냐) software(nodejs와 같은 서..
pytorch lstm data는 dacon에 운동 동작 분류 AI 경진대회 사용했다. dacon.io/competitions/official/235689/data/ 간단하게 각 user마다 600개의 움직임이 있고 이걸 61 label로 분류하는 거임ㅇㅇ 이걸 pytorch lstm으로 구현해보자 www.kaggle.com/omershect/learning-pytorch-lstm-deep-learning-with-m5-data 여기를 많이 참고했다 train=pd.read_csv(PATH+'train_features.csv') train_labels=pd.read_csv(PATH+'train_labels.csv') test=pd.read_csv(PATH+'test_features.csv') submission=pd.read_..
9장 동시성 제어와 회복을 지원하기위해 트랜잭션 제공한다. 트랜잭션 예시 만약에 320명 갱신하다가 컴퓨터 꺼지면 어떻게하나? log(로그) 유지해서 튜플들 수정한 기록 남겨논다. 위에 경우는 둘중 하나만 돼서는 안된다. 둘다되거나 아니면 둘다 안되거나해야됨 즉 하나의 트랜잭션(단위)처럼 DBMS가 보장해야한다. 컴퓨터는 뭐가 트랜잭션인지 모르니까 저렇게 범위를 사람이 지정해줘야한다. commit하고 예약완료 메세지 보내야한다. 트랜잭션의 특성 4가지 1. 원자성 2. 일관성 디비는 일관성 - 일시적 비일관성 - 또다른 일관성 3. 고립성 4. 지속성 관계 완료와 철회 9.2 동시성 제어 여러 사람들이 동시에 테이블 접근해서 트랜잭션 사용하니까 트랜젝션 잘 관리해야한다. 동시성 제어 안할시 생길수 있는 문제들..
8장 뷰 & 시스템 카탈로그 먼저 뷰에 대해서 알아보자 with check option은 생략가능 예시 뷰쓰면 DBMS에서 실행 과정 뷰의 장점 릴레이션 바껴도 view에서는 영향 없다. 독립성 제공 보안기능 제공 뷰의 갱신 상황 1. 한 릴레이션에서 만들어진 뷰에 대한 갱신 상황 2. 두개의 릴레이션에서 만들어진 뷰에 대한 갱신 기본키인 사원번호가 없어서 삽입 거절당함 상황 3. 집답함수가 포함된 뷰 집답함수니까 당연히 안되지 타당하지 않음 갱신 불가능한 뷰 DBMS마다 지원하는게 다름 시스템 카탈로그 8.3 데이터 사전은 세 종류가 있다. 예시 그냥pdf한번 읽으셈
7장 릴레이션 정규화 이상하게 설계하면 중복생겨서 갱신 이상 유발한다 갱신 이상에는 세가지가 있다 나쁜 설계 문제점 1. 3개 부서보다 더 많이 속하면 릴레이션을 바꾸거나 애트리뷰트 추가해야된다. 2. 3개 미만으로 속하면 null값 넣어서 공간 낭비 그럼 이런식으로 튜플을 여러개 사용해서 해결할 수 있다. 하지만 이런 방법도 정보의 중복(부서말고 다 중복됨) 저장공간 낭비, 수정 이상(만약 부서이름이 바꼈을 때 모든 튜플의 부서이름 변경해야된다.) 해결방법 릴레이션 분해 정규화 db설계 지침 함수의 종속성 결정자 예시 두가지 표현 방법 결정자가 두개있을때 두개다 종속하면 완전 둘중 하나만 종속하면 부분함수적 종속성 이행적 함수적 종속석 A -> C ^ C -> B 여기서 A는 학번 C는 학과이름 B는 학과전..
6장 논리적인 설계를 물리적인 데이터 모델로 사상한다 실제로 db를 저장하는 보조 기억 장치 테이프는 백업용 탐색할때 같은 실린더에 있으면 효율적이라서 같은 실린더에 두는게 중요하다. 디스크에 화일 레코드 배치 6.8 6.9보다 좋은 지연 관리 방법 대부분 사용한다. 화일 조직 1. 히프파일 2.순차 파일 탐색은 좋은데 유지하는데 비용든다. 6.5 단일 단계 인덱스 기본 인덱스(primary index) 탐색 키가 데이터 화일의 기본 키인 인덱스를 기본 인덱스라고 부름 기본 인덱스는 기본 키의 값에 따라 정렬된 데이터 화일에 대해 정의됨 기본 인덱스는 흔히 희소 인덱스로 유지할 수 있음 각 릴레이션마다 최대한 한 개의 기본 인덱스를 가질 수 있음 희소인덱스는 블럭을 가르킨다. 클러스티링 인덱스 보조인덱스 블럭..