炼数成金 大数据分布式系统
订阅

分布式系统

得此笔记,皆得分布式(上篇)
得此笔记,皆得分布式(上篇)
【笔记】1、Log的价值1) Log是如下系统的核心:分布式图数据库分布式搜索引擎Hadoop第一代和第二代K-V数据库2) Log可能跟计算机的历史一样长,并且是分布式数据系统和实时计算系统的核心。3) Log的名字很多:Commit ...
如何在裸机中自动安装部署CoreOS和Kubernetes
如何在裸机中自动安装部署CoreOS和Kubernetes
先介绍一下背景随着光音业务规模的上升,线上业务产品的数量及服务器的采购量也越来越大。当达到一定数量级后,就不能使用常规的维护方法来解决这些问题。以前,一旦业务量上去,我们就不得不停下手头的开发工作,部 ...
最新版本 Mesos 发布,解密 6 大新特性
最新版本 Mesos 发布,解密 6 大新特性
最新的Mesos版本0.23.0,现在可以下载了。这次版本包含了以下特点和变动:1、容器的网络隔离Mesos 0.23 提供支持在容器部署前定义网络的监控和隔离规则。网络隔离避免了单个容器占用太多的端口、太多的带宽,以及造 ...
Eagle - 来自eBay的分布式实时监控及预警框架
Eagle - 来自eBay的分布式实时监控及预警框架
Eagle 是来自eBay的面向大型分布式系统比如Hadoop, Spark 以及Cloud等设计的通用实时监控与与预警框架。Eagle主要由基础的核心框架以及针对不同应用领域的诸多app组成,专注于解决大数据时代大型分布式系统自身监控这 ...
如何在 Fedora 22 上面配置 Apache 的 Docker 容器
如何在 Fedora 22 上面配置 Apache 的 Docker 容器
在这篇文章中,我们将会学习关于Docker的一些知识,如何使用Docker部署Apache httpd服务,并且共享到Docker Hub上面去。首先,我们学习怎样拉取和使用Docker Hub里面的镜像,然后在一个Fedora 22的镜像上交互式地安 ...
RebornDB:下一代分布式Key-Value数据库
RebornDB:下一代分布式Key-Value数据库
RebornDB是一个基于代理的分布式Redis集群解决方案,有点像twemproxy。它有一个杀手锏:动态的切分数据集,即透明的重新切分数据而不影响目前正在运行的服务。现实世界有许多的Key-Value数据库,它们都被广泛应用于 ...
全方位对比Mesos、Omega、Borg
全方位对比Mesos、Omega、Borg
在大数据领域,集群主要受存储限制,因此运维不断地增加新的机架,更新规格来扩展群集容量。这意味着节点可以有不同的CPU、内存容量、磁盘数量等。这样的节点还可以配入指定的附加设备,如固态硬盘、图形处理器、重 ...
构建分布式系统的技术考量
构建分布式系统的技术考量
下面来聊聊测试吧。对于小型应用来说,我会使用JUnit和Mock对象,通过工具来模拟邮件服务器。不过在分布式系统下,出现非确定性行为的概率会大很多。在大规模分布式系统中,负载很高并且出错概率很大的情况下该如何 ...
分布式系统的特点以及设计理念
分布式系统的特点以及设计理念
正是这些分布式系统,使得Google可以处理高并发请求响应以及海量数据处理等。Apache旗下的Hadoop、Spark、Mesos等分布式系统,把大数据处理相关技术变得非常亲民,让更多企业客户体会到了分布式系统的便利。
基于Mesos和Docker的分布式计算平台
基于Mesos和Docker的分布式计算平台
针对“互联网+”时代的业务增长、变化速度及大规模计算的需求,廉价的、高可扩展的分布式x86集群已成为标准解决方案,如Google已经在几千万台服务器上部署分布式系统。Docker及其相关技术的出现和发展,又给大规模集 ...
ZStack深度试用:部署、架构与网络及其与OpenStack的对比
ZStack深度试用:部署、架构与网络及其与OpenStack的对比
文是ZStack的深度试用报告,分别从部署、架构和网络三个层面介绍作者的试用体验,并与OpenStack进行简单对比,文章最后也对ZStack的改进方向提出了思考。以下为全文内容:“这是最好的时代,也是最坏的时代”。这句 ...
关于Ceph现状与未来的一些思考
关于Ceph现状与未来的一些思考
Ceph从2004年提交了第一行代码,至今为止已经10年了。这个起源于Sage博士论文,最早致力于开发下一代高性能分布式文件系统的项目,现在也成为了开源社区众人皆知的明星项目。特别是随着云计算的发展,Ceph乘上了Open ...
Apache Drill 1.0发布
Apache Drill 1.0发布
虽然大数据往往将关系型数据库当作靶子,但事实上真正生产环境的Hadoop和Spark等大数据平台,每天大部分工作仍然是为SQL查询提供服务,所以,SQL on Hadoop就成了竞争最激烈的技术领域。5月19日,Apache基金会宣布针 ...
微软发布分布式大规模图数据处理引擎 Graph Engine 1.0 预览版
微软发布分布式大规模图数据处理引擎 Graph Engine 1.0 预览版
由 Microsoft Research 开发的 Graph Engine 1.0 预览版正式发布。Graph Engine 是一个基于内存的分布式大规模图数据处理引擎。在此之前,它在学术界更广为人之的名称是Trinity。大规模图处理在很多领域扮演着重要的 ...
Druid:一个用于大数据实时处理的开源分布式系统
Druid:一个用于大数据实时处理的开源分布式系统
Druid是一个用于大数据实时查询和分析的高容错、高性能开源分布式系统,旨在快速处理大规模的数据,并能够实现快速查询和分析。尤其是当发生代码部署、机器故障以及其他产品系统遇到宕机等情况时,Druid仍能够保持10 ...

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

社区热帖

     

    GMT+8, 2019-3-24 17:07 , Processed in 0.140452 second(s), 16 queries .