Home

Search results

"category:/Cloud"

1 2 3 Next >>

Title and summary Date/time
1
가상 환경에서 Chef 훅 돌려보기
Chef의 이해 1. Chef 구조 Chef는 Server & Client모델을 따르는 프레임워크로 Chef Server, Workstations, Node로 운영된다. Chef Server는 인프라 (설정)정보를 저장하기 위한 Chef 코드 저장소를 가지고 있어, Chef 코드를 Chef Server에서 집중해서 관리한다. Chef Server로는 REST API를 통해 접근이 가능하며, WebUI를 이용해서도 Chef Server의 인프라를 ...
Nov 15, 2013
7:35:37 PM
2
veewee를 통해 glu(linkedin의 배포 및 모니터링 툴) 테스트 환경 자동화
veewee 도구를 활용해서 VM 이미지를 자동으로 만들어서 테스트 환경을 구축해 놓으면, 나중에도 동일한 환경 구성과 다른 개발자들도 쉽게 테스트 환경을 만들어 줄 수 있어서 시간 절약에 도움이 많이 된다. 그래서 보통 box 이미지는 Vagrantbox.es에서 여러가지 OS의 Box를 다운받아서 사용한다. 하지만, 그 안에는 원하는 형태의 소프트웨어가 안들어 있을 수도 있고, 표준 시간대 등 변경 사항들이 있을 수 있고 또, 바이러스 등도 존재할 ...
Jun 27, 2013
5:28:15 PM
3
[번역] Urban Airship(Push 서비스)에서 C500k를 위해 벌인 일들
푸시 서버를 구축하는 분들이라면 Urban Airship 블로그를 관심있게 볼 필요가 있습니다. 푸시 서버 구축에 대한 시행착오나 튜닝 정보들을 포스팅하고 있어 도움이 될법한 콘텐츠들이 많습니다. 그 중 오늘은 "C500k in Action at Urban Airship"이란 아티클을 의역해 봅니다. 2000년쯤에는 c10k라는 문제(동시접속 만개를 해결하는 문제)가 주로 화두였는데, 현재는 c500k 도 이미 해결된 상태죠. Urban ...
Jul 18, 2012
6:10:54 PM
4
클라우드 환경에서 새로운 ACID, BASE 그리고 CAP
클라우드 환경에서 아키텍처와 프로그래밍 모델이 변화하고 또 진화하고 있는데 대해서 제가 이해를 하고자 메모했던 내용을 좀 더 구체화해서 부족하나마 정리해 봅니다. 새로운 ACID 모델들 ACID는 RDBMS의 설계 사상과 관련하여 NoSQL이나 NwqSQL이 출현되면서 자주 회자되었던 용어이다. 기존의 관점에서 ACID의 기본 개념은 아래와 같다. Atomic(원자성)은 트랜잭션과 관련된 작업들이 모두 수행되었는지 아니면 모두 실행이 안되었는지를 ...
Jul 3, 2012
9:48:59 AM
5
Vert.x - Node.js를 대체할 수 있는 프레임워크
Node.js에 필적할 만한 비동기 병렬 처리 프레임워크인 Vert.x가 이슈화되고 있는 것 같아서 Vert.x가 어떤 놈인지 살펴보고자 한다. Vert.x의 주요 내용은 InfoQ에서 기술한 vert.x ? JVM Polyglot Alternative to Node.js 아티클을 참고로 하여 기술하며 부족한 부분은 vertx.io의 내용을 참고하여 추가했다. Vert.x 개요 Vert.x는 비동기적으로 확장 가능한 병렬 처리 어플리케이션을 위한 ...
Jun 18, 2012
3:50:18 PM
6
OpenMP를 이용한 병렬 프로그래밍
개요 OpenMP는 여러개의 프로세스가 공유된 메모리를 참조하는 환경에서 다중 스레드 병렬 프로그래밍을 위한 표준 스펙이다. 여기에서 제공하는 API를 통해 사용자들은 어플리케이션의 성능 향상을 얻을 수 있게 된다. OpenMP의 주요 동기요인은 성능, 확장성, 이식성, 표준성을 목표로 한다. 그리고 C, C++(#으로 시작), Fortran(90에서는 !$로 시작)을 지원하고 있다. 역사로는 1997년에 Fortran 1.0가 최초로 나왔고 그 ...
May 30, 2012
10:45:49 AM
7
웹기반 Cloud IDE eXo로 PaaS 플랫폼 디플로이하기
이젠 이클립스를 PC에 깔지 않고 웹에서 프로젝트 개발이 가능하고 서버 구매도 없이 무료 PaaS에서 서비스나 앱을 운영할 수 있는 시대가 오고 있다. 노트북이나 아이패스 등만 가지고 카페나 인터넷이 되는 곳은 어디나 개발 장소가 되는 시대입니다. 1. 가입하기 Cloud-ide eXo에서 회원 가입하고 난 다음 이메일로 계정 활성화 하고, 개인 정보 추가 입력하면 정상적으로 가입이 된다. 2. 데모 프로젝트 만들기 만들어진 개인 ...
May 24, 2012
8:12:06 PM
8
Cloud Foundry의 모든 것들
Cloud Foundry가 실현된다는 것은 가상화를 통해 추상화된 하드웨어에서 개발, 배포 및 운영 자동화를 실현한 새로운 인프라라고 생각해도 될 것으로 보인다. 그래서 본 포스트는 Cloud Foundry에 대해 모든 것들을 정리해 보고자 한다. Cloud Foundry 소개 Cloud Foundry는 VM웨어의 Open PaaS 전략에 따라 2011년 4월 발표된 오픈 소스 PaaS 소프트웨어(Ruby로 구현)에서 VM웨어가 인수한 ...
May 22, 2012
2:39:48 PM
9
BaaS(Backend as a Service) 에 대하여
BaaS(Backend as a Service)이란 무엇인가? 클라우드 환경의 접속 장치로 PC보다는 iPhone이나 Android 같은 모바일 디바이스가 보편화되고 있다. 앞으로의 클라우드 애플 리케이션의 주역은 모바일 디바이스에서 움직임이 일어날 가능성이 크다는 의미도 포함하고 있는 것이다. 그래서 작은 틈새 시장중에 하나인 모바일 애플 리케이션에 특화된 클라우드 형태로 BaaS(Backend as a Service)라는 서비스가 등장하고 있다. ...
May 5, 2012
1:30:51 PM
10
Consistent Hashing
NoSQL 관련 기술 중에 하나인 Consistent Hashing의 개념은 1997년에 MIT의 karger가 웹서버의 숫자가 수시로 변경되는 중에 분산 요청을 처리하기 위해 처음 고안했다고 하는데 그 내용을 살펴보고자 한다. 아래의 내용은 'Consistent Hashing' 이라는 아티클을 많이 참조해서 작성했다. 왜 필요한가? N개의 캐시 시스템(노드)이 있다고 하고 이때 부하 분산에 사용하는 일반적인 방법은 Object o를 hash(o) ...
May 4, 2012
12:27:32 PM
11
WEKA - Classification, Clustering
WEKA는 Mining 알고리즘을 테스트 해보고 실제로 구현도 가능한 오픈 소스 툴이다. Hadoop등 빅 데이터 플랫폼이 준비가 안된 환경에서도 쉽게 샘플링 데이터를 가지고 마이닝 알고리즘을 테스트 해 볼 수 있는 장점이 있다. 1. WEKA 다운로드 - 다운로드 : http://www.cs.waikat...
Apr 18, 2012
2:48:15 PM
12
Merkle trees(Hash trees)
Merkle trees는 NoSQL의 요소 기술 중에 하나입니다. 관련 기술에 대해 정리해 봅니다. 기억을 메모하기 위해... 1. 개요 1979년 Ralph C. Merkle가 최초로 제안한 Merkle trees는 위의 그림과 같이 구성된다. Leaf 노드는 데이터의 블럭(파일이나 파일들의 집합)의 해쉬값이고 각 노드들은 자식의 해시 값을 나타낸다. 부모 노드의 top을 top hash (root hash 혹은 master hash)라고 불린다. ...
Apr 17, 2012
9:55:09 PM
13
Mahout - Random Forests
1. Random Forest 개요 Random Forest는 Leo Breiman과 Adele Cutler에 의해 개발된, decision tree들이 여러 개 모여서 만들어진 ensemble classifier이다.새로운 object에 대한 input vector를 이용하여 분류하기 위해서는, forest내 각 tree에 input vector을 넣는다. 각 tree는 classification 결과를 주게 되는데, 이를 그 class에 대한 ...
Apr 11, 2012
7:30:38 PM
14
Snappy(오픈 소스 압축 툴) 개요
1. 개요 Snappy는 압축/압축해제 라이브러리며 주요 목적이 높은 압축률이나 다른 압축라이브러리와의 호환성에 중점을 둔 것이 아니라, 매우 빠른 속도의 압축 속도와 합리적인 압축률을 제공하는 것에 중점을 두고 있는 오픈 소스 압축 툴이다. 2. 특징 빠르고 - 압축속도는 어셈블리 코드 없이 250MB/sec. 안정성이 있으며 - 몇년 동안, Snappy는 구글 환경에서 수 페타바이트 이상의 압축과 해제를 수행해 왔다. 견고성도 보유하고 있고 : ...
Apr 10, 2012
4:58:55 PM
15
K-Means Clustering
1. K-Means Clustering 임의로 k 개의 평균 점을 찍은 후, 그 점들로 부터 가까운 것들로 k의 그룹으로 나눈다.(Expectation) 또, 다시 각각의 그룹들 안에서 새로운 평균점을 찍고(Maximization) 그룹을 나누는 것을 반복한다. 주로 다른 알고리즘을 쓰기 전에 preprocessing 으로 많이 쓰이며 Predictive나 고객/시장 세분화용으로 활용된다. 2. Hadoop, Mahout를 활용한 k-means ...
Apr 8, 2012
4:45:13 PM
16
Sentiment Analysis
보통 Sentiment Analysis은 텍스트에 포함된 내용이 주관적(Subjective)인지 객관적(Objective)인지를 먼저 판별하고, 주관적이면 극성(Polarity)을 분석하여 내용이 긍정적(Positive)인지 부정적(Negative)인지 판별하고 나서 상품이나 브랜드 등의 여론이 긍정인지, 부정인지를 찾아내는데 주로 활용된다. 특히 Brand Reputation, 정치 등 다양한 여론을 수렴할 때 많이 사용된다. 1. 긍정/부정을 ...
Apr 6, 2012
8:07:53 PM
17
Bayes' Theorem과 Mahout를 활용한 스팸 필터링
1. Naive Bayes Classification Bayes' Theorem에 근거한 분류법이며, Bayes' Theorem은 조건부 확률에서는 새로운 정보를 알았을 때 확률의 개선이 일어나게 된다. 어떤 실험결과에서 나온 정보를 이용하여 어떤 사건의 처음 확률을 개선시킬 수 있는데, 여기서 처음 확률은 사전확률 (prior probability) 이라 하고, 개선된 확률을 사후확률 (posterior probability) 이라고 하며, 이러한 ...
Apr 3, 2012
2:31:17 PM
18
Bloom Filter 개요
NoSQL의 아키텍처를 이해할려면 다음과 같은 내용들에 대해서 알아야 할 것입니다. Bloom Filter, Vector Clocks, Gossip Protocol, Dynamo, Paxos, MapReduce, CAP, Eventual Consistency, Column Storage, Consistent Hashing, Hinted Handoff, Read Repair, Write Ahead. 오늘은 그중에서 성능과 밀접한 관계가 있는 Bloom ...
Mar 30, 2012
3:38:10 PM
19
Mahout를 활용한 영화 추천 샘플링
1. 기계 학습 개요 - Collaborative filtering : 사람들 중에 나와 비슷한 기호를 가지고 있는 사람이 추천 점수를 순위를 매겨서 활용함. User-based : 유사한 사용자를 찾아서 항목을 추천. 사용자가 많을 경우 성능 저하가 됨. Item-based : Item 간의 유사성을 계산하여 추천. 미리 비슷한 상품들은 계산해 놓고(item similarity table 유지 비용은 있지만) 추천할때 필터링하면 성능 효과를 볼 수 ...
Mar 23, 2012
6:16:09 PM
20
Storm과 Esper로 실시간 분석 샘플 사용기
현재의 Big Data 분석 관점에서 실시간성이 가장 중요한 포인트 중에 하나다. 과거에는 Big Data 분석에서 알고리즘 분석에 치중한 나머지 데이터 제공은 Batch Processing에 머물러 있었는데, 최근 들어 Twitter Storm, Apache S4 등이 나오면서 실시간성 분석이 필요한 트렌드나 실시간 급상승 인기 검색어, Abuse 트래픽/고객 인식 등의 비즈니스에서 Big Data 분석과 실시간성이 결합된 추세가 되었다. 그래서 ...
Mar 14, 2012
6:56:11 PM

1 2 3 Next >>